漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

谷歌研究院近日宣布启动一项名为Amplify的全球数据收集计划,通过与各地区本土专家合作,旨在提升人工智能在服务不足地区的适用性。该计划聚焦非主流语言和文化场景下的数据缺口,采用社区共建模式采集高质量标注数据,涉及医疗、农业、本地化服务等垂直领域。技术层面采用联邦学习框架确保数据隐私,同时开发新型数据清洗算法以处理低资源语言的语义歧义问题。这一举措或将改变当前AI训练数据中英语内容占比超78%的失衡现状,为Gemini等大模型在全球化部署中的文化适应性提供底层支持。

核心要点

  • 谷歌联合本土专家启动全球数据共建计划Amplify
  • 重点解决非英语地区AI训练数据匮乏问题
  • 采用联邦学习技术保障数据隐私与安全性

Read more >