漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-21 talkingdev

开源|别纠结Agent怎么配了,OpenProse让你用大白话搞定一切

当大家都在为如何配置AI Agent(提示词、MCP服务器、运行框架参数)而焦头烂额时,一个新的开源语言——OpenProse提出了一个颠覆性的想法:忘掉“怎么配”,专注于“要什么”。OpenProse是一种面向AI会话的新语言,它允许...

Read More
2026-05-21 talkingdev

开源|字节跳动Lance:3B参数原生统一多模态模型,图像视频理解与生成编辑全搞定

字节跳动近日在GitHub上开源了一款名为Lance的原生统一多模态模型,以其仅3B(30亿)激活参数的设计,在AI领域引起了广泛关注。该模型打破了传统多模态模型需要为不同任务(如图像理解、视频生成、图像编辑等)分别...

Read More
2026-05-20 talkingdev

Gemini 3.5发布:前沿智能与主动执行能力深度融合

在Google I/O大会上,Google正式发布了其最新一代大语言模型系列——Gemini 3.5。这一版本是Gemini系列的重大升级,首款推出的模型为超快速的3.5 Flash版本,专为在Google搜索等应用中直接处理复杂任务而优化。在多项...

Read More
2026-05-20 talkingdev

谷歌搜索迎来史上最大更新,AI代理时代开启:Gemini 3.5 Flash集成与智能任务自动化

谷歌搜索即将迎来其历史上规模最大的更新,标志着AI搜索进入一个全新的纪元。此次更新的核心是深度整合最新的Gemini 3.5 Flash模型,并将其融入到一个全新的AI搜索框中,从而引入“后台代理”机制。这些智能代理能够自...

Read More
2026-05-20 talkingdev

AI2发布OlmoEarth v1.1:行星级遥感分析成本骤降3倍,性能不变

艾伦人工智能研究所(Ai2)最新发布的OlmoEarth v1.1模型家族,在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术,将处理遥感数据的计算成本最高降低至原来的三分之一(即3倍效率提升...

Read More
2026-05-19 talkingdev

开源|大模型预训练的“模式跳跃”:语言模型如何从鹦鹉学舌到展现智能?

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...

Read More
2026-05-19 talkingdev

开源|HRM-Text:1B参数文本生成模型,训练成本仅为传统模型的几百分之一

近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...

Read More
2026-05-19 talkingdev

揭密大模型内部的政治审查机制:Qwen3.5-9B权重中的可读“审查开关”

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page