OpenAI以65亿美元股权全资收购了与苹果前设计总监Jony Ive共同创立的合资公司io,标志着这家AI巨头正式进军硬件领域。此次收购不仅涉及巨额资金,更凸显了OpenAI从纯软件向软硬结合的战略转型。Jony Ive作为主导iPho...
Read More苹果公司近日在GitHub开源了CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》的官方实现代码库。该项目提出了一种高效的视觉编码方法,旨在优化视觉语言模型(VLM)中的视觉信息处...
Read MoreKindle Comic Converter(KCC)是一款专为电子墨水屏设备优化的漫画和漫画转换工具,支持Kindle、Kobo、ReMarkable等多种电子阅读器。该工具通过去除页边距、支持固定布局以及针对电子墨水屏特性的图像处理,确保漫...
Read MoreFrancesco和Alessandro推出的c/ua项目(https://www.trycua.com)是一款革命性的Docker风格容器运行时,允许AI代理在轻量级、隔离的虚拟机中驱动完整操作系统。该项目已完全开源(https://github.com/trycua/cua),...
Read More开源游戏引擎Godot近日在GitHub上合并了关键性Pull Request(#105628),宣布实现对Apple visionOS平台的原生支持。这一技术突破意味着开发者可以直接在Godot引擎中为苹果的混合现实头显开发原生应用,无需通过转译...
Read More近日,技术领域迎来一项创新突破——HDR-Infused Emoji正式发布。这一技术将高动态范围(HDR)成像应用于Emoji设计,显著提升了表情符号的色彩表现力和视觉冲击力。传统Emoji受限于标准动态范围(SDR),色彩层次和亮...
Read More近日,Sesame发布了一款1B规模的对话语音生成模型,并在GitHub上开源了其Apple原生MLX版本。该版本专为在MacBook等苹果设备上高效运行而优化,展示了机器学习在移动设备上的应用潜力。MLX是苹果公司推出的机器学习框...
Read More苹果公司正计划在iOS 19系统中为AirPods推出一项新的实时翻译功能,允许用户通过AirPods听到语音的翻译版本,若用户通过iPhone回应,则手机扬声器会播放出翻译后的内容。此外,苹果还计划在本年度对iOS、iPadOS和mac...
Read More