埃隆·马斯克旗下的人工智能公司xAI宣布,其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦(1GW)功率规模的专用人工智能训练集群,标志着AI基础设施竞赛进入了一个新的量级门...
Read More近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...
Read MoreAnthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于,它允许Claude Code根据实际需求,动态地将模型上下文协议工具加载到工作上下文中,而非传统的一次性全...
Read More近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...
Read More英伟达创始人兼CEO黄仁勋近日宣布,其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息,Vera Rubin平台在训练特定大型语言模型时,所需芯片数量可大幅减少至当前旗舰Blackwell架构平...
Read More软银集团(SoftBank Group Corp.)今日宣布,已完成对人工智能研究公司OpenAI的225亿美元追加投资。此举标志着软银在今年3月承诺的总额高达400亿美元投资计划已全部完成,使其在OpenAI的持股比例达到约11%。这笔巨额...
Read More近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导,其核心目标是简化从复杂网页中提取结构化信息的流程,并将...
Read More近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好的网络爬虫与数据抓取解决方案。该项目由开发者unclecode主导,其核心目标是简化从网页中提取结构化信息的过程,并将这些数据高...
Read More