语言模型的相关内容 - 漫话开发者

2025-03-13 talkingdev

谷歌发布开源权重模型Gemma 3，性能接近Gemini 1.5 Pro

谷歌近日发布了Gemma 3模型的权重和技术报告，这一模型共有四种规模，其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色，能够理解超过140种语言，还被认为是接近当前最先进的密集模型之一。这一发布...

2025-03-11 talkingdev

这项研究探索了如何通过强化学习来教授AI语言模型解决数独谜题，特别采用了Group Relative Policy Optimization (GRPO)技术，应用于Qwen 2.5等模型，无需依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励...

2025-03-11 talkingdev

最新研究展示了如何通过强化学习技术，使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法，并在Qwen 2.5等模型上进行了实验，无需依赖外部数据或更大模型的蒸馏。研...

2025-03-11 talkingdev

近期，一项关于视觉语言模型（Vision Language Models）的研究引起了广泛关注。该研究通过结合简单可验证奖励机制与规模化强化学习（Scaled Reinforcement Learning），显著提升了模型的性能。研究团队在论文中详细...

2025-03-11 talkingdev

概率人工智能（Probabilistic Artificial Intelligence）作为人工智能领域的重要分支，近年来在学术界和工业界引起了广泛关注。其核心思想是通过概率模型来处理不确定性问题，从而提升AI系统的决策能力和鲁棒性。与...

2025-03-10 talkingdev

近日，一款轻量级的自回归流式文本转语音模型在GitHub上发布。该模型仅包含3000万参数，能够与任何语言模型（LLM）结合，使其具备理解和生成语音的能力，以响应通用查询。这一技术的核心优势在于，它无需对底层模型...

2025-03-05 talkingdev

VARGPT是一种多模态大语言模型（MLLM），其独特之处在于将视觉理解与生成功能统一在一个自回归框架内。这一创新设计使得VARGPT能够同时处理文本和图像数据，实现更高效的跨模态信息处理。通过自回归机制，VARGPT不仅...

2025-03-04 talkingdev

近日，一项关于LLM（大语言模型）自我奖励推理的研究引起了广泛关注。该研究提出了一种创新的两阶段训练框架，使模型能够独立生成推理步骤、自我评估正确性，并在无需外部反馈的情况下迭代优化输出。这一框架结合了...