漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-16 talkingdev

Knowpat-特定领域的AI问答系统开源

近日,有学者在GitHub上发布了一项新的研究项目,名为“知识偏好对齐(KnowPAT)”,该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术,可以更加精准地针对特定领域提出问题,从而得到更加准确...

Read More
2023-11-16 talkingdev

降低多模态语言模型的幻觉: AMBER发布开源库

AMBER是一个新的基准,旨在评估和降低多模式大型语言模型(MLLM)中的幻觉,而不依赖其他高级语言模型。该项目已经发布开源库,旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。

Read More
2023-11-16 talkingdev

You.com推出新API,为LLMs连接互联网提供支持

You.com已经推出了一系列API,价格从每月100美元起,使得像Meta的Llama 2这样的大型语言模型可以访问最新的互联网数据,并通过网络搜索和新闻功能提供增强的答案准确性。这些API有助于LLMs从更广泛的数据来源中汲取...

Read More
2023-11-16 talkingdev

微软终于开始制造自己的定制芯片,而这次定制芯片全部都与人工智能有关

微软公司为训练大型语言模型建立了自己的定制人工智能芯片。它还开发了用于云工作负载的基于Arm的CPU。这两款芯片将于2024年推出。它们可能会减少行业对英伟达的依赖。微软已经在设计这些芯片的第二代版本。更多关于...

Read More
2023-11-13 talkingdev

LM4Visual-基于AI文本模型来进行视觉任务

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...

Read More
2023-11-09 talkingdev

Nvidia正在为工程师推出生成式AI进行试点测试

Nvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲,介绍了一款名为ChipNeMo的大型语言模型,旨在提高芯片设计师的生产力。尽管尚未完全证明,但ChipNeMo有助于为设计工具编写脚本,总结错误报告,并为设计师提...

Read More
2023-11-08 talkingdev

利用LLM提高推荐系统精度的新方法

近日,研究人员提出了一种名为CLLM4Rec的全新方法,该方法通过高级预训练和新型语言嵌入,将大型语言模型与基于ID的系统相结合,提高了推荐精度。研究人员表示,CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page