机器人的相关内容 - 漫话开发者

2025-04-28 talkingdev

Character.AI发布AvatarFX：AI视频模型可生成逼真聊天机器人

Character.AI近日推出了一款名为AvatarFX的视频生成模型，该技术能够为AI生成的角色赋予动画效果，并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力，但其可能被滥用于制作深度伪造（deepfake）视频的隐患也...

2025-04-24 talkingdev

马斯克旗下人工智能公司xAI推出的Grok聊天机器人近日迎来重要升级，新增了视觉识别能力。这一功能允许iOS用户上传图片或通过摄像头捕捉画面，随后向Grok提问关于所看到内容的问题。该功能与OpenAI的ChatGPT和谷歌的G...

2025-04-23 talkingdev

日本科技企业Ainos与ugo近日取得重大技术突破，成功将AI Nose人工智能嗅觉系统集成至人形机器人平台。该技术通过高精度气体传感器阵列与深度学习算法，使机器人具备人类级别的气味识别能力，可实时解析环境中的化学...

2025-04-23 talkingdev

Physical Intelligence团队近期对其研发的家用清洁机器人Pi-0.5进行了测试，结果显示该机器人在全新的、未见过的环境中表现卓越。这一成果得益于团队采用的视觉语言模型（VLM）训练与动作标记化（action tokenizatio...

2025-04-22 talkingdev

由Arjun、Ramnique和Akhilesh团队开发的Rowboat（https://www.rowboatlabs.com/）是一款专为多智能体系统设计的AI辅助集成开发环境（IDE）。该工具通过聊天式Copilot实现从单智能体到协作团队的扩展，支持MCP工具集...

2025-04-19 talkingdev

近日，Raspberry Pi基金会正式发布基于其单板计算机的Lidar扫描解决方案，该设备通过脉冲激光测距技术可实现毫米级精度的三维环境建模。这款兼容Raspberry Pi 4/5的Lidar模块采用TOF（飞行时间）原理，最大测距达12...

2025-04-18 talkingdev

谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架，这一突破性技术通过整合视觉语言对比学习（Contrastive Learning）与场景描述（Captioning）两大前沿方向，实现了对三维场景的多模态联合理解。该框...

2025-04-15 talkingdev

InteractVLM作为新一代视觉语言模型(VLM)，实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型，结合多视角渲染技术，将2D推理能力提升至3D空间，能够精准分析人类与物体在三维环境中的接触关系。...