据报道,Nvidia正在准备一款系统芯片(SoC),该芯片将Arm的Cortex-X5核心设计与基于Nvidia Blackwell架构的GPU相结合。这一组合旨在提升人工智能计算性能,为PC提供更强大的AI处理能力。Nvidia的这一举措可能会显著...
Read MoreMozilla公司最近成功训练了一款可以在浏览器内运行,并自动为网页图片生成替代文本(Alt文本)的模型。这一创新技术旨在提高网页的无障碍性,使视力障碍用户能够更好地理解网页内容。通过在本地运行模型,Mozilla不...
Read MoreReworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...
Read More智能专家系统是一种利用大型语言模型(LLMs)进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求,大大简化了文本分类过程。LLMs具备强大的自然语言处理能力,能够更高效地理解和分类复杂的文...
Read MoreMeta公司近日宣布发布一种名为Chameleon的全新模型,该模型可以像GPT-4o那样同时操作图像和文本。相比于许多其他的替代模型,Chameleon展现出了更好的性能。据悉,Meta团队在内部模型上已经远远超越了这项工作。该模...
Read More在技术领域,一种名为MasterWeaver的新方法被提出,以提高个性化文本到图像生成模型的性能。这种技术的出现,无疑为AI领域的图像生成技术开辟了新的可能性,使得文本到图像的转换过程更为精确和个性化。MasterWeaver...
Read More最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆,特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道,为持续的模型改进提供了可能性。而这一突破性的发展,不仅提升了英汉文本...
Read MoreInternLM-XComposer2是一种在创建和理解复杂的文本-图像内容方面表现优异的视觉语言模型。该模型引入了一种名为Partial LoRA的新型方法,用以平衡视觉和文本的理解,其性能超越了现有的多模态内容创建和理解模型。通...
Read More