漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

浏览器如何隔离内部音频和麦克风输入?

近日有网友发出问题:浏览器如何隔离内部音频和麦克风输入?对此,业内专家指出,浏览器为了保护用户的隐私,会采取一系列技术手段来隔离内部音频和麦克风输入,比如使用WebRTC API(Web Real-Time Communications A...

Read More
2024-07-09 talkingdev

CD Pregap是如何获得隐蔽音轨超能力的

CD Pregap是指光盘上的音轨0,它通常用于放置隐藏的音乐曲目,因为CD播放器只会读取从第一音轨开始的音乐曲目。但是,这并不是CD Pregap的本意。实际上,Pregap是为了在CD播放器上播放其它多媒体内容而设计的,比如...

Read More
2024-07-09 talkingdev

Doti:AI驱动的健康生活管理助手新品发布

Doti,一款由人工智能驱动的健康生活管理助手,近日正式发布。Doti的主要功能在于协助用户有效管理其健康和生活目标。通过使用先进的AI技术,Doti能深度学习用户的生活习惯和健康状况,然后提供个性化的建议和解决方...

Read More
2024-07-09 talkingdev

ChatGPT的编程能力究竟如何?

OpenAI的ChatGPT在代码生成方面的表现有所不同,成功率根据任务难度和编程语言的不同,范围在1%以下到89%之间。这表明ChatGPT在某些方面可能具有较高的编程能力,但在其他方面可能稍显不足。这主要取决于所使用的编...

Read More
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
2024-07-09 talkingdev

MIT利用阴影构建3D场景模型,包括被遮挡的物体

MIT和Meta的研究人员开发了一种名为PlatoNeRF的人工智能技术,该技术利用阴影和单光子激光雷达来创建3D场景模型,包括被遮挡的区域。这种方法可以增强自动驾驶车辆的安全性,并改善AR/VR体验。PlatoNeRF超越了传统方...

Read More
2024-07-09 talkingdev

超分辨率技术AnySR开源,支持任意尺度,任意资源

GitHub最近发布了一种名为AnySR的全新单图像超分辨率(SISR)技术,这种技术改善了效率和可扩展性。与传统方法不同,AnySR支持'任意尺度,任意资源'的实现,无需额外参数即可减少较小尺度的资源需求。这种技术的灵活...

Read More
2024-07-09 talkingdev

论文:从休闲视频中无人监督估计类别级3D姿态

科研人员已经开发出一种新的方法,可以从休闲的,以对象为中心的视频中,无需人类监督就可以估计出类别级的3D姿态。这种新方法的开发,无疑为3D姿态估计领域带来了新的突破。在无人监督的情况下,能够从视频中准确估...

Read More
  1. Prev Page
  2. 200
  3. 201
  4. 202
  5. Next Page