大型语言模型的相关内容 - 漫话开发者

2025-02-27 talkingdev

LLM推理能力研究：System 2思维在大型语言模型中的应用

近期，一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力，对这些模型进行了基准测试。结果显示，尽管LLM在复杂任务中表现出色，但在需...

2025-02-26 talkingdev

近日，一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM（大型语言模型）技术，成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA（低秩适应）和RAG（检索增强生成）等技术，该...

2025-02-21 talkingdev

DeepEval是一个开源框架，专注于评估和测试大型语言模型系统。它整合了最新的研究成果，通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...

2025-02-21 talkingdev

Figure公司近日展示了一款新型Vision-Language-Action（VLA）模型，专为人形机器人设计。VLA模型通过结合视觉和语言命令处理信息，使得机器人能够通过视频和大型语言模型的组合进行训练。Figure的Helix模型特别引人...

2025-02-20 talkingdev

近日，BadSeek项目揭示了如何在大型语言模型（LLM）中植入后门的技术细节。该项目通过深入研究LLM的embedding机制，展示了如何在不影响模型整体性能的情况下，植入特定的触发机制，从而在特定条件下激活后门功能。这...

2025-02-14 talkingdev

近日，研究人员通过优化技术展示了大型语言模型（LLMs）在减少非embedding参数的同时仍能保持学习能力。研究表明，通过用优化的子网络替换密集层，LLMs可以在减少高达77%的参数的情况下，依然保持与原有模型相当的性...

2025-02-13 talkingdev

OpenAI近日公布了其GPT系列模型的未来发展路线图，计划在推出GPT-5之前，先发布GPT-4.5作为最后一个非链式思维（non-chain-of-thought）模型。GPT-5将实现o-series与GPT-series模型的统一，标志着OpenAI在大型语言模...

2025-02-10 talkingdev

近日，一项研究提出了一种创新方法，通过无数据余弦相似度技术追踪稀疏自编码器在大型语言模型（LLM）连续层中发现的特征演化过程。该方法能够映射特征的持久性、转换和涌现，生成跨层特征图。研究表明，这些特征图...