漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-14 talkingdev

开源|Steel Browser:专为AI智能体与自动化应用打造的全能浏览器API

近日,开源项目Steel Browser在GitHub发布,为AI智能体与自动化应用提供了完整的浏览器控制解决方案。该项目通过Puppeteer实现全功能浏览器操控,支持会话管理、代理配置、插件扩展及资源优化等核心功能。其创新性在...

Read More
2025-09-28 talkingdev

在微型星球上送信:这款WebGL游戏如何用前沿技术重塑交互体验

近日,一款名为《Messenger》的WebGL游戏引发科技社区广泛关注,该游戏允许玩家在微型星球表面进行信息传递任务,展示了WebGL技术在浏览器端实现复杂3D渲染的潜力。游戏通过物理引擎模拟星球重力环境,结合低多边形...

Read More
2025-09-19 talkingdev

开源|Deep Chat:一行代码为网站添加可定制AI聊天组件

Deep Chat是一款高度可定制的AI聊天组件,开发者仅需一行代码即可将其集成到网站中。该项目支持文件共享、摄像头调用、语音通信、Markdown渲染等先进功能,并能无缝对接OpenAI、Hugging Face等主流AI平台的API接口。...

Read More
2025-06-25 talkingdev

ElevenLabs推出个人AI语音助手11.ai,集成多平台工作流

人工智能语音技术公司ElevenLabs近日发布了名为11.ai的个人AI语音助手,该产品以其低延迟特性脱颖而出,并深度整合了Perplexity、Linear、Slack和Notion等主流生产力平台。通过MCP(多通道处理)集成技术,11.ai能够...

Read More
2025-06-23 talkingdev

Character.AI任命前Meta高管Karandeep Anand为新任CEO,加速多模态娱乐领域布局

人工智能交互平台Character.AI近日宣布重大人事变动,前Meta商业产品负责人Karandeep Anand正式出任首席执行官。Anand此前曾担任公司顾问,此次履新将主导该平台在多模态娱乐领域的战略扩张。作为Meta系资深专家,An...

Read More
2025-05-23 talkingdev

开源Web Agent框架:用自然语言描述网页结构

Notte Labs近日在GitHub上开源了一款名为Notte的Web Agent框架,该框架旨在构建能够浏览并与网站交互的AI智能体。其核心创新在于引入了一个"感知层"(perception layer),该技术能够将网页内容转化为结构化的自然语...

Read More
2025-05-19 talkingdev

[论文推荐]WavReward:基于音频语言模型的对话系统评估新方法

来自arXiv的最新研究论文提出了一种名为WavReward的创新评估系统,该系统基于音频语言模型,专门用于评估语音对话系统在认知和情感指标上的表现。WavReward通过在ChatReward-30K数据集上进行训练,该数据集包含了大...

Read More
2025-05-06 talkingdev

[开源] 实时AI语音对话项目RealtimeVoiceChat:延迟低至500毫秒

GitHub上的开源项目RealtimeVoiceChat由开发者KoljaB推出,旨在实现与AI的自然语音对话,其延迟时间可控制在约500毫秒内,接近实时交互水平。该项目采用先进的语音识别和生成技术,结合高效的网络传输协议,显著提升...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page