LLM的相关内容 - 漫话开发者

2025-02-27 talkingdev

LLM推理能力研究：System 2思维在大型语言模型中的应用

近期，一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力，对这些模型进行了基准测试。结果显示，尽管LLM在复杂任务中表现出色，但在需...

2025-02-26 talkingdev

近日，一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM（大型语言模型）技术，成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA（低秩适应）和RAG（检索增强生成）等技术，该...

2025-02-26 talkingdev

近日，EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相，旨在评估多模态大语言模型（MLLMs）在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务，这对模型的感知、推理和执行能力提...

2025-02-25 talkingdev

近日，Browser Use (YC W25) 宣布推出其开源项目——Web Agents，旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术，能够模拟人类在网页上的操作行为，如点击、滚动、填写表单等。通...

2025-02-25 talkingdev

近日，一项名为Text4VPR的创新技术成功将视觉与语言结合，为移动机器人提供了仅通过文本描述即可实现地点识别的能力。这一技术突破了传统视觉定位的局限，使得机器人在复杂环境中能够更高效地识别和定位目标地点。Te...

2025-02-25 talkingdev

近日，Moonshot发布了一项名为Block Attention混合算法的创新技术，该算法在长上下文语言模型（LLM）中的应用表现卓越，被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制，显著提升了模型在处理长文...

2025-02-25 talkingdev

近日，LLM-SRec技术通过将用户序列行为直接整合到LLM（大语言模型）中，显著提升了推荐系统的准确性，且无需进行额外的模型微调。这一创新方法不仅简化了推荐系统的开发流程，还实现了推荐精度的新突破，成为当前推...

2025-02-24 talkingdev

近日，OmniServe发布了一个全新的统一框架，旨在优化大规模LLM（大语言模型）的部署效率。该框架结合了低比特量化和稀疏注意力机制等创新技术，显著提升了模型推理速度并降低了成本。通过低比特量化，OmniServe能够...