漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-22 talkingdev

苹果发布新无障碍功能,包含眼动追踪技术

苹果公司宣布即将推出一系列利用AI和机器学习的新无障碍功能,其中包括iPad的眼动追踪技术、使用前置摄像头进行iPhone导航、以及通过自定义声音让Siri执行任务的语音快捷方式。其他即将推出的功能还包括音乐触感反馈...

Read More
2024-05-20 talkingdev

MoonDream-基于WebGPU实现在线运行大模型

MoonDream在最新的实验中,利用WebGPU的推断功能,直接在网络上运行了一个小型的MoonDream VLM。这一实验的成功,标志着MoonDream在提升其在线服务能力方面又迈出了重要的一步。WebGPU是一种新型的网络图形技术,它...

Read More
2024-05-20 talkingdev

Julius AI推出首个R语言AI代码解释器

Julius AI近日发布了首个针对编程语言R的AI代码解释器,这可能将彻底改变学术研究者进行统计分析的方式。R语言是一种广泛应用于统计计算和图形表示的编程语言,它在学术研究中被广泛使用,尤其在数据分析和机器学习...

Read More
2024-05-17 talkingdev

纯NumPy实现的Llama3模型——Llama3.np

近日,在GitHub上出现了一个新的项目,名为Llama3.np,这是一个纯NumPy实现的Llama 3模型。NumPy是一种使用Python进行科学计算的基础软件包,而Llama 3模型则是一种流行的机器学习模型。Llama3.np 项目旨在提供一种...

Read More
2024-05-16 talkingdev

Hopfield Boosting技术开源,检测机器学习模型中的分布外数据

Hopfield Boosting是一种技术,该技术利用现代Hopfield能量来增强在机器学习模型中对分布外(OOD)数据的检测。在机器学习中,处理OOD数据一直是一项挑战,因为这些数据往往不符合模型的预期分布。通过Hopfield Boos...

Read More
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-15 talkingdev

Google推出全新轻量级模型Gemini Flash,拥有多模态推理和高达百万Token上下文窗口

近日,Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术,使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...

Read More
2024-05-13 talkingdev

Text2Any开源模型:Lumina引领全新一代技术革新

Lumina是一个新一代的项目,其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替,这种方法提高了下游性能。Lumina项目带来的这种全新技术,将对未来的人工智能、机器学习和深度...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page