漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

苹果研究团队推出ReALM系统,性能超越GPT-4

苹果公司的人工智能研究人员开发了一种新型系统ReALM,该系统通过考虑屏幕上的内容、对话中的实体以及背景信息,增强了Siri理解上下文的能力。在基准测试中,ReALM系统的性能超过了ChatGPT 4.0。这一突破性的技术进...

Read More
2024-03-29 talkingdev

Meta为雷朋智能眼镜引入AI功能

Meta公司正计划为其雷朋品牌的智能眼镜增加人工智能功能。这些功能将包括实时翻译以及通过语音命令激活的物体、动物和纪念碑识别。这一创新将为用户带来更加便捷的交互体验,使得智能眼镜不仅仅是一种时尚配饰,更是...

Read More
2024-03-29 talkingdev

Hume推出情感语音界面 引领人工智能新趋势

Hume公司近日发布了一项创新产品——情感语音界面(Empathic Voice Interface,简称EVI),这是首款集成了情感智能的对话式人工智能技术。EVI能够理解和模拟人类情感,通过语音交互提供更为自然、贴心的用户体验。这一...

Read More
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
2024-01-15 talkingdev

亚马逊Alexa得到新的生成式AI驱动体验

在CES上,亚马逊展示了开发者Character.AI、Splash和Volley提供的新的生成式AI驱动Alexa体验。这些体验增强了智能助手的互动性和创造力。Character.AI展示了一种名为“Alexa's Dream”的生成式AI体验,该体验将Alexa带...

Read More
2024-01-10 talkingdev

CrewAI开源自主智能代理编排平台

CrewAI是一个旨在增强协作智能并使这些代理能够在复杂任务中有效地协同工作的自主AI代理编排平台。它为复杂的多代理交互提供了结构,并为各种应用程序(包括智能助手平台和自动化客户服务)设计。CrewAI的目标是提供...

Read More
2023-10-13 talkingdev

whispering-llama:最新开源多模态融合技术以增强语音识别

研究人员开发了一种新技术,将声音信息和语言数据结合起来,纠正自动语音识别系统中的错误。该技术基于交叉模态融合,使用视觉和语言信息来提供更准确的识别结果。此外,该技术还可以提供更好的语音合成能力。研究人...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page