漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

论文:视觉语言模型遇到难题:新基准测试与改进方向

视觉语言模型(VLMs)在处理输入图像时,有时会遇到无法回答的问题。即便是最先进的VLMs,如GPT-4V,也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试,并探讨了一些可能的改进方向。研究者们通过...

Read More
2024-04-01 talkingdev

自动驾驶赛车如何推动无人驾驶汽车技术的进步

自动驾驶赛车通过在高压条件下应用人工智能和机器学习技术,正推动无人驾驶汽车技术的发展。例如,Indy Autonomous Challenge等竞赛正在加速车辆安全性方面的创新。研究者和学生利用F1tenth等平台开发算法,在实际赛...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
2024-04-01 talkingdev

VoiceCraft项目发布:700M参数模型实现零样本语音克隆与合成

近期,一项名为VoiceCraft的开源项目在GitHub上引起了广泛关注。该项目通过一个强大的700M参数模型,实现了零样本(Zero shot)的语音克隆和语音合成功能。这意味着用户无需进行任何额外的训练,就能够利用该模型复...

Read More
2024-04-01 talkingdev

微软与OpenAI合作打造价值千亿美元的超级计算机

据报道,微软和OpenAI正在计划合作建立一个联合数据中心项目,该项目的总投资可能达到1000亿美元,旨在到2028年推出一款名为“星际之门”的巨型AI超级计算机。这一举措将进一步推动人工智能领域的发展,并可能改变云计...

Read More
2024-03-29 talkingdev

谷歌将Gemini Nano技术引入Pixel 8手机 提升录音与键盘智能回复功能

谷歌宣布,即将推出的Pixel 8手机将在开发者预览版中集成Gemini Nano技术。这一技术的应用旨在增强手机内置应用的功能,特别是录音器中的'Summarize'摘要功能和Gboard键盘的'Smart Reply'智能回复功能。Gemini Nano...

Read More
2024-03-29 talkingdev

Meta为雷朋智能眼镜引入AI功能

Meta公司正计划为其雷朋品牌的智能眼镜增加人工智能功能。这些功能将包括实时翻译以及通过语音命令激活的物体、动物和纪念碑识别。这一创新将为用户带来更加便捷的交互体验,使得智能眼镜不仅仅是一种时尚配饰,更是...

Read More
2024-03-29 talkingdev

Coframe发布全新图像优化工具:利用生成型AI技术提升网站图像效率

Coframe公司近日推出了一项创新产品——Coframe Living Images,这是一款基于生成型人工智能技术的图像优化工具。通过使用该工具,网站管理员能够在短短几分钟内对网站图片进行A/B测试和优化,从而显著提高网站的用户...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page