漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-22 talkingdev

苹果前设计大师Jony Ive将出任OpenAI要职 涉足硬件开发领域

OpenAI以65亿美元股权全资收购了与苹果前设计总监Jony Ive共同创立的合资公司io,标志着这家AI巨头正式进军硬件领域。此次收购不仅涉及巨额资金,更凸显了OpenAI从纯软件向软硬结合的战略转型。Jony Ive作为主导iPho...

Read More
2025-05-12 talkingdev

[开源]FastVLM:苹果发布高效视觉语言模型视觉编码方案,CVPR 2025论文实现

苹果公司近日在GitHub开源了CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》的官方实现代码库。该项目提出了一种高效的视觉编码方法,旨在优化视觉语言模型(VLM)中的视觉信息处...

Read More
2025-05-07 talkingdev

KCC开源:专为电子墨水屏设计的漫画转换工具

Kindle Comic Converter(KCC)是一款专为电子墨水屏设备优化的漫画和漫画转换工具,支持Kindle、Kobo、ReMarkable等多种电子阅读器。该工具通过去除页边距、支持固定布局以及针对电子墨水屏特性的图像处理,确保漫...

Read More
2025-04-23 talkingdev

Cua:开源Docker容器技术,让AI智能体安全驱动完整操作系统

Francesco和Alessandro推出的c/ua项目(https://www.trycua.com)是一款革命性的Docker风格容器运行时,允许AI代理在轻量级、隔离的虚拟机中驱动完整操作系统。该项目已完全开源(https://github.com/trycua/cua),...

Read More
2025-04-22 talkingdev

[开源] Godot引擎正式支持visionOS原生平台

开源游戏引擎Godot近日在GitHub上合并了关键性Pull Request(#105628),宣布实现对Apple visionOS平台的原生支持。这一技术突破意味着开发者可以直接在Godot引擎中为苹果的混合现实头显开发原生应用,无需通过转译...

Read More
2025-04-17 talkingdev

HDR技术赋能Emoji:新一代高动态范围表情符号亮相

近日,技术领域迎来一项创新突破——HDR-Infused Emoji正式发布。这一技术将高动态范围(HDR)成像应用于Emoji设计,显著提升了表情符号的色彩表现力和视觉冲击力。传统Emoji受限于标准动态范围(SDR),色彩层次和亮...

Read More
2025-03-18 talkingdev

[开源] CSM语音模型在MLX上的高效运行

近日,Sesame发布了一款1B规模的对话语音生成模型,并在GitHub上开源了其Apple原生MLX版本。该版本专为在MacBook等苹果设备上高效运行而优化,展示了机器学习在移动设备上的应用潜力。MLX是苹果公司推出的机器学习框...

Read More
2025-03-14 talkingdev

苹果计划在iOS 19中为AirPods推出实时翻译功能

苹果公司正计划在iOS 19系统中为AirPods推出一项新的实时翻译功能,允许用户通过AirPods听到语音的翻译版本,若用户通过iPhone回应,则手机扬声器会播放出翻译后的内容。此外,苹果还计划在本年度对iOS、iPadOS和mac...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page