大语言模型的相关内容 - 漫话开发者

2026-06-05 talkingdev

开源|Anthropic发布自动化漏洞挖掘与修复框架：Defending Code Reference Harness

Anthropic公司近日在GitHub上开源了其自动化漏洞发现与修复参考框架——Defending Code Reference Harness。该框架集成了威胁建模、代码扫描、风险分级和补丁生成等核心安全能力，并提供了一个高度可定制的自动化扫描...

2026-06-05 talkingdev

随着本地大语言模型（LLM）的普及，Ollama作为一款简洁的本地模型运行工具，受到开发者和研究者的广泛关注。然而，面对众多不同参数规模、训练策略的Ollama模型，如何快速、客观地选出最适合特定任务的模型，成为实...

2026-06-03 talkingdev

在处理长文本或长时间序列时，标准Transformer模型的内存占用和计算复杂度会随序列长度平方级增长，并面临信息稀释问题。GitHub上最新开源的“Wall Attention”项目提出了一种极具创新性的注意力变体机制：通过引入带...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-06-02 talkingdev

Perplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”（Search as Code，简称 SaC）的全新搜索架构范式。该方案通过提供一个软件开发工具包（SDK），赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...

2026-06-01 talkingdev

Odysseus是一款开源自托管AI工作空间，旨在为用户提供一个私密、可控且可扩展的AI集成环境。该项目托管于GitHub，吸引了社区广泛关注，目前已获得152个点赞和72条评论。在数据隐私和模型自主权日益重要的今天，Odyss...

2026-05-29 talkingdev

在生产环境中部署基于大语言模型（LLM）的智能体（Agent）时，如何准确评估其在复杂、长上下文任务中的表现一直是个难题。传统LLM评测员（Judge）在处理涉及多步推理、状态验证和动态调整的Agent轨迹时，常出现事实...

2026-05-28 talkingdev

在AI和文档处理领域，PDF解析一直是一个棘手但关键的环节。近日，LlamaIndex团队推出的LiteParse v2.0版本引发了开发者社区的广泛关注。该项目完全采用Rust语言从零重写，彻底摆脱了对大语言模型（LLM）或云端服务的...