漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-06 talkingdev

OpenRouter年度重磅报告:推理模型已占AI使用量半壁江山,开源模型采用率持续攀升

根据AI模型聚合平台OpenRouter发布的最新年度研究报告,通过对过去一年内超过100万亿个令牌(tokens)的实证分析,揭示了当前AI模型使用格局的重大转变。报告指出,以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

Read More
2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破:Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码,首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

Read More
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
2025-08-06 talkingdev

OpenAI发布两款开源推理模型:gpt-oss-120b与gpt-oss-20b

OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...

Read More
2025-08-06 talkingdev

开源|OpenAI发布Harmony响应格式渲染器,助力gpt-oss开源模型结构化输出

OpenAI近日在GitHub上开源了Harmony响应格式的渲染器项目,该项目专为其gpt-oss系列开源权重模型设计,旨在实现对话输出的结构化处理。Harmony格式通过Rust编写的核心模块与Python绑定,提供了高效的格式解析与渲染...

Read More
2025-06-27 talkingdev

FLUX.1 Kontext [dev]发布开源权重:消费级硬件实现专业级图像编辑性能

FLUX.1 Kontext [dev]作为一款拥有120亿参数的开源模型,突破性地在消费级硬件上实现了媲美商业闭源软件的图像编辑性能。该模型采用FLUX.1非商业许可协议开放权重,为学术研究和非商业应用提供免费访问权限。技术亮...

Read More
2025-06-27 talkingdev

谷歌发布多模态开源模型Gemma 3n:支持文本、图像和音频输入

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n,该模型采用多模态设计,专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入,展现了强大的跨模态处理能力。为推广该模型,谷歌与AMD、Axolotl、Docker...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page