在生产环境中部署基于大语言模型(LLM)的智能体(Agent)时,如何准确评估其在复杂、长上下文任务中的表现一直是个难题。传统LLM评测员(Judge)在处理涉及多步推理、状态验证和动态调整的Agent轨迹时,常出现事实...
Read MoreCate是一款创新的空间桌面IDE,其核心特色在于提供了一个无限缩放的画布,允许开发者在一个广阔的空间工作区内灵活排布代码编辑器、终端、浏览器面板等工具。这种设计打破了传统IDE的固定窗口布局,让开发者能够像整...
Read More近日,AI领域两大领军企业Anthropic与OpenAI被曝已成功探索出产品与市场的高度契合模式。据业内人士透露,Anthropic很可能将迎来首个盈利季度,而越来越多的企业客户正在为日益增长的LLM使用费用感到惊讶。这种商业...
Read More在AI和文档处理领域,PDF解析一直是一个棘手但关键的环节。近日,LlamaIndex团队推出的LiteParse v2.0版本引发了开发者社区的广泛关注。该项目完全采用Rust语言从零重写,彻底摆脱了对大语言模型(LLM)或云端服务的...
Read MoreOpenAI 近日发布了一项名为 Secure MCP Tunnel 的新功能,旨在解决企业级用户将私有或本地 MCP 服务器与 OpenAI 产品安全连接的核心痛点。该技术通过一个仅支持出站连接的隧道(outbound-only tunnel),允许用户在...
Read MoreHugging Face 团队近日发布了一项名为“Delta Weight Sync”的创新技术,旨在解决大规模强化学习(RL)训练中的通信瓶颈问题。在训练拥有万亿参数量的模型时,传统的权重同步方式需要在训练器(Trainer)和推理引擎(I...
Read MoreBiohub近日向全球研究人员开放了其蛋白质结构预测、设计与生物发现的开源引擎,标志着蛋白质生物学领域迈入AI驱动的新阶段。该发布包含三个核心模型:ESMC,一种最先进的语言模型,内化了支配蛋白质生物学的基本属性...
Read More人工智能软件工程师Devin的开发商Cognition近日宣布完成超过10亿美元的新一轮融资,公司估值达到260亿美元。本轮融资由Lux Capital、General Catalyst和8VC等知名投资机构领投。Devin作为一款AI驱动的软件工程师,已...
Read More