大模型的相关内容 - 漫话开发者

2026-06-08 talkingdev

开源|阿里重磅开源Open Code Review：混合架构+AI Agent，代码审查精准到行级

阿里巴巴近日在GitHub上开源了一款名为Open Code Review的AI驱动代码审查工具，引发了开发者社区的广泛关注。该工具的核心突破在于其独特的“混合架构”：它并非单纯依赖大语言模型（LLM）的生成能力，而是将确定性的...

2026-06-06 talkingdev

在人工智能顶级会议ICLR 2026上，一篇题为《Transformer are inherently succinct》的论文被评选为三篇杰出论文之一。该研究从理论层面深入论证了Transformer架构在本质上具有简洁性（succinctness），即模型能够在...

2026-06-05 talkingdev

Tether团队近日发布了QVAC SDK的最新版本，这是一款面向本地设备、专注于构建跨平台P2P应用的开源工具包。此次更新的核心亮点在于集成了名为TurboQuant的全新优化技术。通过这一技术，开发者在相同硬件条件下，能够...

2026-06-05 talkingdev

随着本地大语言模型（LLM）的普及，Ollama作为一款简洁的本地模型运行工具，受到开发者和研究者的广泛关注。然而，面对众多不同参数规模、训练策略的Ollama模型，如何快速、客观地选出最适合特定任务的模型，成为实...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-29 talkingdev

Anthropic近日正式发布其最新旗舰级模型Claude Opus 4.8，这是对其Opus系列的一次重要升级。该模型在编码、智能体任务和专业工作等多个维度上展现出更强的性能，并显著提升了处理长时间复杂工作的一致性。除了核心能...

2026-05-21 talkingdev

当大家都在为如何配置AI Agent（提示词、MCP服务器、运行框架参数）而焦头烂额时，一个新的开源语言——OpenProse提出了一个颠覆性的想法：忘掉“怎么配”，专注于“要什么”。OpenProse是一种面向AI会话的新语言，它允许...