语言模型的相关内容 - 漫话开发者

2025-04-03 talkingdev

[开源]大规模医学推理数据集MedReason发布，推动可解释医疗AI研究

加州大学圣克鲁兹分校视觉、语言与行为实验室（VLAA）在GitHub开源了MedReason项目，这是一个专为提升大语言模型（LLM）医疗推理能力构建的大规模数据集。该数据集通过结构化临床案例、医学知识图谱和多模态数据，旨...

2025-04-02 talkingdev

腾讯ARC实验室最新发布的SEED-Bench-R1基准测试，为多模态大语言模型（MLLM）在复杂视频任务中的表现提供了系统评估框架。该研究重点关注强化学习（RL）和监督微调（SFT）等后训练方法，揭示了RL在视觉感知任务和数...

2025-04-01 talkingdev

最新发表在arXiv的论文提出了一种创新的模型融合技术，能够从大型语言模型(LLM)中精准移除敏感内容，同时保持模型的通用知识能力。这项突破性研究通过参数空间分析，识别并分离与敏感信息相关的神经网络连接，实现了...

2025-03-31 talkingdev

传统检索增强生成（RAG）系统采用语义搜索+文档生成的二阶段流程，虽能实现基础问答，但存在上下文理解浅层化和无关信息干扰的缺陷。GitHub最新开源的ReAG（Reasoning Augmented Generation）通过革命性的一体化架构...

2025-03-28 talkingdev

随着人工智能技术的飞速发展，大型语言模型（LLM）的复杂性和能力不断提升，但其内部决策过程仍被视为“黑箱”。近日，研究人员通过先进的追踪技术，成功揭示了LLM在生成文本时的思维路径。这一突破不仅有助于提升模型...

2025-03-27 talkingdev

Model Context Protocol（MCP）是一种为大型语言模型提供工具和上下文的方式。它是一个开放协议，提供标准化的方法来连接AI模型与不同的数据源和工具。现在，OpenAI的Agents SDK已经支持MCP，这使得开发者可以使用广...

2025-03-26 talkingdev

Midjourney近期发布了一项重要工作，旨在提升创意写作模型的多样性表现。该团队通过对一个较小的7B模型进行后训练，使其在创意写作任务中的表现超越了更大规模的开放和封闭模型。这一突破不仅展示了模型优化技术的潜...

2025-03-26 talkingdev

近日，Qwen团队发布了一款名为Qwen 2.5 32B的视觉语言模型，该模型不仅具备强大的多模态处理能力，而且完全开源，能够在消费级硬件上高效运行。这一重大突破为AI领域的研究者和开发者提供了更加灵活和便捷的工具，尤...