模型训练的相关内容 - 漫话开发者

2026-07-21 talkingdev

索尼音乐二次起诉AI音乐公司Udio：指控其非法复制3万余首录音训练模型

索尼音乐娱乐对AI音乐生成平台Udio提起了第二起版权侵权诉讼，指控该公司在未经授权的情况下，复制了多达30,117首受版权保护的录音，用于训练其人工智能音乐生成模型。此次诉讼标志着音乐产业与AI技术公司之间版权战...

2026-07-18 talkingdev

中国国家数据管理局最新数据显示，2026年3月全国每日AI令牌消耗量已突破140万亿枚，较2025年12月的100万亿枚和2024年初的1000亿枚呈指数级增长。这一数字背后折射出中国科技巨头在人工智能领域的疯狂竞速，大模型训...

2026-07-17 talkingdev

据《华尔街日报》援引知情人士消息，对冲基金 Coatue Management 正在领投数据分析软件公司 Databricks 新一轮约 30 亿美元的融资，此轮融资将使 Databricks 的估值达到 1880 亿美元，较其 2024 年 12 月的估值大幅...

2026-07-16 talkingdev

OpenAI 正式发布了其新一代自动化安全测试系统 GPT-Red。该系统不再依赖传统人工红队测试，而是通过大规模的自我博弈机制，让模型在对抗中持续进化。具体而言，GPT-Red 被训练成能够迭代式生成对抗性提示，系统性地...

2026-07-15 talkingdev

据《华尔街日报》披露，阿联酋因在伊朗相关军事行动中为美国提供关键协助，获得了美国政府放宽人工智能芯片出口限制的回报。这一地缘技术交易使阿联酋主权AI机构G42得以在至少九个月内自由采购先进的美国AI芯片，不...

2026-07-14 talkingdev

本文对 xAI 官方发布的 Grok Build 编程命令行工具（CLI）版本 0.2.93 进行了深度的线缆级流量分析，重点探究该工具在与 xAI 服务器交互时实际传输和存储的数据内容。分析结果显示，CLI 会将其读取的文件内容原封不...

2026-07-13 talkingdev

一项新研究探索了利用稀疏技术高效训练大语言模型的方法，旨在显著减少算力开销的同时保持模型性能。该方案通过引入结构化稀疏与动态剪枝策略，在训练前期识别并冻结低重要性参数，使有效参数量呈指数级下降，从而降...

2026-07-12 talkingdev

在大语言模型后训练中，强化学习正变得愈发关键，但面向长周期智能体任务时，传统同步、批次交替的RL流程效率低下。异步强化学习通过随到随更新的方式提升了效率，然而现有系统多偏重吞吐量，训练稳定性和任务有效性...