漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-05 talkingdev

揭开OpenAI创始人Sam Altman投资帝国的神秘面纱

Sam Altman是硅谷最为高产且激进的个人投资者之一。他所管理的投资帝国,截至今年年初,持有的资产价值至少为28亿美元。然而,这个投资组合的大部分内容并不为人所熟知。这篇文章将带领读者了解Altman投资的已知部分...

Read More
2024-06-04 talkingdev

Amazon推出Project Pi AI 确保产品出货前无瑕疵

Amazon最新推出的Project Pi AI项目,利用人工智能和计算机视觉技术,在产品出货前检测产品缺陷或规格不符的情况。这一创新技术旨在提高质量控制,减少退货率。通过在生产过程中引入AI,Amazon能够更加精确地识别潜...

Read More
2024-06-04 talkingdev

MegActor模型开源,实现逼真肖像动画生成

MegActor是一个新型模型,它利用原始驾驶视频来实现更逼真的肖像动画。通过一种新颖的数据生成框架和背景编码技术,MegActor在解决身份泄露和背景干扰问题上取得了令人瞩目的成果。该模型的核心创新在于其数据生成框...

Read More
2024-06-04 talkingdev

Mamba-2:强大的状态空间模型发布第二版

Mamba团队发布了Mamba-2,这是他们强大的状态空间模型的第二个版本。Mamba-2在前一版本的基础上进行了多项改进,显著提升了模型的性能和稳定性。该团队还提供了一份详细的说明文档,详细介绍了Mamba-2的技术细节和具...

Read More
2024-06-04 talkingdev

Quaise Energy创新微波技术,推动地热能应用

Quaise Energy计划利用gyrotron(微波发生器)钻探技术,通过高功率的线性束真空管产生毫米级长度的电磁波来蒸发岩石,大幅降低钻探至极深地层的成本和时间。Gyrotron技术原本用于核聚变研究中加热和控制等离子体。...

Read More
2024-06-03 talkingdev

Mora:挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

Read More
2024-06-03 talkingdev

Conifer开源:显著提升LLM对复杂指令的理解能力

Conifer通过引入一个专门的数据集和渐进式学习方法,显著提升了大规模语言模型(LLM)对复杂指令的理解能力。该方法不仅能让LLM在处理复杂任务时表现得更为精准,还能有效减少错误率。专门的数据集涵盖了各类复杂指...

Read More
2024-06-03 talkingdev

论文:随机颜色擦除提升计算机视觉模型鲁棒性

研究人员开发了一种名为随机颜色擦除的新学习策略,旨在解决计算机视觉中的颜色偏差问题。该方法通过从训练数据中选择性地移除颜色信息,平衡颜色与其他特征的重要性,从而提高模型在复杂场景中的表现,如广域监控和...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page