AI语言模型的相关内容 - 漫话开发者

2025-03-11 talkingdev

利用强化学习教授语言模型解决数独问题

这项研究探索了如何通过强化学习来教授AI语言模型解决数独谜题，特别采用了Group Relative Policy Optimization (GRPO)技术，应用于Qwen 2.5等模型，无需依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励...

2025-03-11 talkingdev

最新研究展示了如何通过强化学习技术，使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法，并在Qwen 2.5等模型上进行了实验，无需依赖外部数据或更大模型的蒸馏。研...

2024-05-28 talkingdev

Anthropic的研究人员近日公布了一种解读其大型语言模型Claude Sonnet内部运作的新方法。他们通过绘制出数百万个与各种概念相对应的特征，成功解析了这个模型的内在机制。这一可解释性研究不仅有助于我们更好地理解AI...

2024-05-02 talkingdev

Anthropic近日推出了其Claude 3 AI语言模型的iOS移动应用，并且引入了一个为团队协作设计的新的订阅级别。Claude 3 AI是Anthropic的最新产物，它可以理解和生成自然语言，提供了一个强大的工具，使得用户可以以更人...

2024-02-22 talkingdev

谷歌推出了一系列新的AI语言模型Gemma，这些模型是基于类似Gemini的技术构建的免费开源模型。Gemma模型可在桌面或笔记本电脑上本地运行，有两个模型，一个有20亿个参数，另一个有70亿个参数。每个模型都有经过预训练...

2023-09-29 talkingdev

DeepMind的大型语言模型Chinchilla 70B可以将图像进行无损压缩，使其仅占原始大小的43.4％，并将音频数据压缩到仅占原始大小的16.4％。

2023-08-28 talkingdev

科研人员已经开发出一种名为CALM的新测试，用来检查AI语言工具是否存在偏见。他们从不同的来源收集了大量的数据，并测试了各种AI模型，结果发现一些大型AI模型的偏见可能比较小的模型更严重。这一发现对于AI领域的研...

2023-07-19 talkingdev

Meta公司发布了新的开源AI语言模型家族Llama 2，其许可证允许其被整合到商业产品中。这些模型的大小从70亿参数到7亿参数不等，据报道，它们在大多数基准测试中表现优于其他开源聊天模型。Llama 2已在Microsoft Azure...