语音识别的相关内容 - 漫话开发者

2024-07-05 talkingdev

SEMamba：一种基于Mamba状态空间模型的语音增强系统

SEMamba是一款全新的语音增强系统，它利用了Mamba状态空间模型来提高语音信号的清晰度。这款语音增强系统的主要目标是通过去噪和清晰的语音信号处理，来提高人们的语音识别和理解。SEMamba系统具有高度的灵活性，能...

2024-06-26 talkingdev

OpenGlass是一款创新的技术项目，其目标是将任何眼镜转变为AI技术驱动的智能眼镜。这款项目的核心理念是利用AI技术，使得传统的眼镜拥有智能眼镜的功能，包括语音识别、图像识别和现实增强等技术。这样，用户无需更...

2024-06-23 talkingdev

Llama.ttf是一种新型字体技术，它不仅可以作为字体使用，还能充当LLM（低级语言模型）的一部分。该技术通过将LLM嵌入字体中，使得字体在呈现文本的同时，也能进行机器学习任务。这项技术的研究者表示，Llama.ttf可以...

2024-06-20 talkingdev

近日，知名的开源平台GitHub上的Paramount项目公开了一项新的技术——LLMs（Large Language Models）的Agent精度测量。该技术旨在提升大型语言模型的代理精度，助力开发者更加准确地评估和优化模型性能。据了解，LLMs...

2024-05-28 talkingdev

近日，计算机科学家们推出了一款名为Llama 3-V的新型人工智能模型，其与GPT4-V性能相当，但模型大小只有GPT4-V的1/100。与GPT4-V的高昂价格相比，Llama 3-V仅需500美元即可获得。这款新型模型可以应用于自然语言处理...

2024-05-22 talkingdev

苹果公司宣布即将推出一系列利用AI和机器学习的新无障碍功能，其中包括iPad的眼动追踪技术、使用前置摄像头进行iPhone导航、以及通过自定义声音让Siri执行任务的语音快捷方式。其他即将推出的功能还包括音乐触感反馈...

2024-05-21 talkingdev

近日，知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司，其技术在搜索引擎、聊天机器人等领域有着广泛应用。...

2024-05-15 talkingdev

近日，Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术，使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...