漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

Meta发布AI新突破:多token预测模型现已开放研究

Meta推出了利用全新的多令牌预测方法的预训练模型,该方法可以同时预测多个未来的词汇,承诺提升性能并大幅度缩短训练时间。这种新颖的多令牌预测方法改变了我们对于未来词汇的预测方式,将其从单一的词汇预测转变为...

Read More
2024-07-09 talkingdev

自主AI Agent:利用AriGraph助力AI记忆图谱构建

AriGraph是一种全新的方法,能够帮助AI Agent构建一个集成了语义记忆和事件记忆的记忆图谱。在此技术的帮助下,AI Agent可以更好地理解和处理各种复杂的情境,从而在各种任务中表现出更高的自主性和智能。此外,通过...

Read More
2024-07-09 talkingdev

特斯拉全新Model Y Project Juniper曝光,预计2025年亮相

近日,一位Reddit用户拍摄到了一辆被覆盖的Model Y,被认为是即将推出的Model Y代号为Juniper的改款车型。测试车辆已在德克萨斯州的Giga工厂和加利福尼亚州的Fremont工厂附近被发现。根据车辆的发展轨迹,预计其将在...

Read More
2024-07-08 talkingdev

2025春季更新:苹果智能助手Siri即将迎来重大改进

苹果智能助手Siri即将在2025年春季的iOS 18.4更新中获得重大改进。这次更新将引入如高级照片搜索等新功能,可能还会引入由AI驱动的表情符号和书写工具。通过这些改进,用户将能够更高效地利用Siri进行各类活动,包括...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-07-08 talkingdev

论文:实时三维重建技术在手术中的应用

一种用于手术场景的三维重建的SfM-free方法已经引入,解决了以前的方法在处理最小化纹理和光度不一致性时的限制。这种新方法的引入,为医学手术带来了新的视野,提升了手术效果和安全性,同时也为未来的医学技术发展...

Read More
2024-07-05 talkingdev

FlexiFilm-新扩散模型助力长视频生成

FlexiFilm 是一种专门为生成超过30秒的长视频而设计的扩散模型,它能够保证生成的视频具有高度的一致性和质量。这一新模型的出现,将在视频制作领域开启新的可能性。视频长度不再受限,而且模型生成的视频质量也得以...

Read More
2024-07-05 talkingdev

OpenStreetView:一个全球图像街景定位数据集开放

OpenStreetView-5M是一个重要的开放获取数据集,包含超过500万张来自225个国家的地理标签街道图像。该数据集旨在通过测试图像定位能力,推动计算机视觉的极限。OpenStreetView-5M不仅覆盖了全球范围内的街道图像,也...

Read More
  1. Prev Page
  2. 68
  3. 69
  4. 70
  5. Next Page