漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-28 talkingdev

Anthropic发布新方法解读大型语言模型Claude Sonnet的内部运作

Anthropic的研究人员近日公布了一种解读其大型语言模型Claude Sonnet内部运作的新方法。他们通过绘制出数百万个与各种概念相对应的特征,成功解析了这个模型的内在机制。这一可解释性研究不仅有助于我们更好地理解AI...

Read More
2024-05-02 talkingdev

Anthropic发布Claude AI聊天机器人iOS应用

Anthropic近日推出了其Claude 3 AI语言模型的iOS移动应用,并且引入了一个为团队协作设计的新的订阅级别。Claude 3 AI是Anthropic的最新产物,它可以理解和生成自然语言,提供了一个强大的工具,使得用户可以以更人...

Read More
2024-02-22 talkingdev

谷歌推出Gemma—免费的开源AI聊天机器人家族

谷歌推出了一系列新的AI语言模型Gemma,这些模型是基于类似Gemini的技术构建的免费开源模型。Gemma模型可在桌面或笔记本电脑上本地运行,有两个模型,一个有20亿个参数,另一个有70亿个参数。每个模型都有经过预训练...

Read More
2023-09-29 talkingdev

研究表明,AI语言模型在无损压缩方面能够超过PNG和FLAC

DeepMind的大型语言模型Chinchilla 70B可以将图像进行无损压缩,使其仅占原始大小的43.4%,并将音频数据压缩到仅占原始大小的16.4%。

Read More
2023-08-28 talkingdev

论文:研究者开发出更好的工具检测AI语言模型的偏见

科研人员已经开发出一种名为CALM的新测试,用来检查AI语言工具是否存在偏见。他们从不同的来源收集了大量的数据,并测试了各种AI模型,结果发现一些大型AI模型的偏见可能比较小的模型更严重。这一发现对于AI领域的研...

Read More
2023-07-19 talkingdev

Meta发布开源AI模型Llama 2,允许商业化应用

Meta公司发布了新的开源AI语言模型家族Llama 2,其许可证允许其被整合到商业产品中。这些模型的大小从70亿参数到7亿参数不等,据报道,它们在大多数基准测试中表现优于其他开源聊天模型。Llama 2已在Microsoft Azure...

Read More
2023-06-13 talkingdev

揭秘大型语言模型中的偏见

近日,研究人员提出了一种名为“对比输入解码(CID)”的新方法,旨在通过生成反映两个略有不同输入的独特特征的文本来揭示AI语言模型对微小变化的反应,从而使其响应更加易于理解和管理。这对于确保公平性和实用性至...

Read More
2023-05-30 talkingdev

与Samantha相遇:AI语言模型的人格化探索

近日,一项新的研究显示,AI语言模型可以模拟人类个体的行为特征,实现人格化。这意味着,只需通过一些精心构建的方法,就能够为AI语言模型赋予人类的个性。研究者采用GPT-4语言模型来构建Samantha,将其作为另一个...

Read More
  1. Next Page