漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-31 talkingdev

Hugging Face发布《Smol训练手册》:揭秘构建顶尖大语言模型的完整实战指南

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南,首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段:从小规模消融实验和基础设施调试,到...

Read More
2025-10-31 talkingdev

揭秘OWL:OpenAI为ChatGPT浏览器Atlas构建的全新架构

OpenAI近日公开了其基于ChatGPT的浏览器Atlas的核心技术突破——OWL(OpenAI's Web Layer)架构。这一创新设计将Chromium浏览器进程从主应用进程中分离,构建独立的服务层,实现了技术架构的质的飞跃。通过进程隔离,A...

Read More
2025-10-31 talkingdev

Kimi Linear技术报告发布:新型架构实现注意力机制效率突破

月之暗面(Moonshot AI)正式发布Kimi Linear技术报告,这项突破性架构通过创新设计实现了对传统全注意力机制的全面超越。该架构在保持同等性能水平下,将KV缓存使用量最高降低75%,在100万上下文长度场景中解码吞吐...

Read More
2025-10-31 talkingdev

OpenAI发布Aardvark:基于GPT-5的自主安全研究智能体

OpenAI近日推出名为Aardvark的智能安全研究代理,目前正处于私有测试阶段。该代理基于GPT-5架构构建,具备自主扫描代码仓库、识别安全漏洞、验证漏洞可利用性及生成修复方案的全流程能力。其核心技术突破体现在三方...

Read More
2025-10-30 talkingdev

Cursor发布Composer:基于强化学习的快速前沿代码生成模型

Cursor公司最新推出的Composer模型标志着AI辅助软件开发领域的重大突破。这款基于混合专家架构的智能体模型,通过强化学习训练实现了前沿代码生成能力,其执行速度达到同类模型的四倍。Composer的核心创新在于其多工...

Read More
2025-10-30 talkingdev

OpenAI发布gpt-oss-safeguard:可定制安全策略的推理模型

OpenAI最新推出的gpt-oss-safeguard系列模型(包含1200亿和200亿参数版本)标志着AI安全技术的重要突破。该模型创新性地允许开发者在推理阶段直接应用定制化安全策略,无需像传统方法那样依赖数千个标注样本训练分类...

Read More
2025-10-30 talkingdev

Cursor 2.0发布:革命性Composer编程模型与多智能体并行开发套件

Cursor 2.0的推出标志着AI编程助手进入全新阶段,其核心突破体现在两大技术革新:首先,全新研发的Composer成为Cursor首个专用编程模型,能够在30秒内完成绝大多数编码任务。该模型通过深度训练具备对大型复杂代码库...

Read More
2025-10-29 talkingdev

Butter:智能缓存技术革新LLM应用,节省成本并提升AI系统确定性

Butter是一项专注于优化大型语言模型(LLM)应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应,显著降低AI系统的运营成本,同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...

Read More
  1. Prev Page
  2. 75
  3. 76
  4. 77
  5. Next Page