近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...
Read MoreSeg-NN框架通过去除对大量预训练的需求,极大地优化了3D分割的流程。这一创新使得模型能够快速适应新的、未见过的类别,同时避免了通常存在的领域差异问题。这一技术突破不仅加快了3D物体识别的速度,还提高了模型的...
Read MoreAMD 宣布将开源其 Radeon GPU 的固件,这一决定意味着技术社区将能够快速改进人工智能框架,同时也可能提高 AMD 产品的市场接受度。开源固件将使得独立开发者和研究人员能够更深入地了解和修改 GPU 底层功能,从而推...
Read MoreInstantStyle是一个全新的图片个性化框架,它通过巧妙地将图片中的风格和内容分离,并专注于特定风格区域,解决了风格一致性的挑战,无需复杂的调整。该框架确保了详尽且一致的视觉风格化效果,并将风格强度与文本控...
Read MoreWandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...
Read More在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...
Read More本文介绍了一种结合人工智能与预测模型的控制框架,旨在实现在密集交通中的平稳和安全变道。该框架通过与周围驾驶员的合作,强调了变道过程中的交互与协调。研究者们通过深入分析交通流动数据,建立了一个能够预测其...
Read MoreCT-RATE是一个将3D医学成像与文本报告相结合的数据集,旨在提供更丰富的医学影像信息。与此同时,CT-CLIP作为一个多功能的人工智能框架,已经针对这些图像进行了优化处理。该框架能够更好地理解和分析医学成像数据,...
Read More