漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-27 talkingdev

Meta AI开始使用用户未公开的私人照片进行训练

据The Verge报道,Facebook(现Meta)用户若选择启用“云处理”功能,将无意中授权Meta AI访问其整个相机胶卷中的照片,包括未公开的私人照片。这一举措引发了广泛关注和争议,涉及用户隐私和数据安全的重大议题。Meta...

Read More
2025-06-27 talkingdev

知识共享组织推出CC signals框架,构建开放AI生态系统新标准

知识共享组织(Creative Commons)近日发布CC signals框架,这一创新性技术规范为数据集持有者提供了明确标注内容机器可复用性的标准化方案。该框架通过结构化元数据,允许版权方精确声明其数据在人工智能训练、模型...

Read More
2025-06-27 talkingdev

OpenAI API新增深度研究与Webhooks功能,助力开发者高效开发

OpenAI近期在其API中新增了两项重要功能:深度研究(Deep Research)和Webhooks。深度研究功能基于经过后期训练的o3和o4-mini模型,这些模型同样为ChatGPT的深度研究提供支持,并支持MCP(多任务控制协议)和代码解...

Read More
2025-06-27 talkingdev

[论文推荐]Meta FAIR团队突破:无需归一化层的Transformer模型通过Dynamic Tanh实现同等性能

Meta旗下FAIR研究团队在arXiv最新论文中提出重大架构革新,通过名为Dynamic Tanh(DyT)的逐元素操作替代传统归一化层,使Transformer模型在保持性能的同时摆脱了对归一化层的依赖。这种S型曲线模拟技术能够自然复现...

Read More
2025-06-27 talkingdev

FLUX.1 Kontext [dev]发布开源权重:消费级硬件实现专业级图像编辑性能

FLUX.1 Kontext [dev]作为一款拥有120亿参数的开源模型,突破性地在消费级硬件上实现了媲美商业闭源软件的图像编辑性能。该模型采用FLUX.1非商业许可协议开放权重,为学术研究和非商业应用提供免费访问权限。技术亮...

Read More
2025-06-27 talkingdev

谷歌发布多模态开源模型Gemma 3n:支持文本、图像和音频输入

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n,该模型采用多模态设计,专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入,展现了强大的跨模态处理能力。为推广该模型,谷歌与AMD、Axolotl、Docker...

Read More
2025-06-27 talkingdev

Meta挖角OpenAI强化学习先驱,加速超级智能研发

据最新报道,Meta已秘密招募OpenAI前强化学习专家Trapit Bansal加入其新成立的AI超级智能部门。这一动作虽未获官方确认,但业内人士分析指出,Bansal的加盟将显著提升Meta在前沿推理模型领域的研发能力。作为深度强...

Read More
2025-06-27 talkingdev

重磅:xAI旗下Grok将推出高级代码编辑器

埃隆·马斯克旗下人工智能公司xAI宣布,其对话式AI产品Grok即将集成高级代码编辑器功能。这一突破性更新允许用户直接在Grok环境中编写、运行和调试代码,并通过自然语言交互实现代码修改与错误排查。技术截图显示,该...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page