漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-04-28 talkingdev

字节跳动宁愿关闭TikTok,也不愿出售

字节跳动宁愿选择关闭在美国的TikTok,也不愿意出售。美国市场只为TikTok的全球收入贡献了四分之一,而且字节跳动旗下所有媒体平台的日活用户中,美国市场只占5%。短时间内完成出售的压力可能会对任何可能的销售价格...

Read More
2024-04-27 talkingdev

苹果收购法国AI公司Datakalab,专注于设备内处理技术

苹果已经收购了总部位于巴黎的人工智能初创公司Datakalab,这是苹果为了提供设备内AI工具的一项举措。Datakalab公司专注于算法压缩和嵌入式AI系统。这次收购显示出苹果对于提升其在设备内处理技术的重视,这也将对苹...

Read More
2024-04-23 talkingdev

WebGPU marching cubes:在浏览器中以原生速度运行的GPU计算

由于WebGPU标准的不断完善,现在可以在浏览器中进行高性能的GPU计算。最近,一组研究人员开发了一种基于WebGPU的算法,称为 'marching cubes',用于在浏览器中进行实时体积渲染。这项技术可以将三维图形数据转换为表...

Read More
2024-04-19 talkingdev

Linux 2022年版推出多路径TCP

据报道,Linux 2022年版将启用多路径TCP,这将有助于提高网络连接的性能和可靠性。多路径TCP可以同时使用多个网络路径来传输数据,从而增加了网络带宽和容错能力。Linux 2022年版的多路径TCP还将采用一种新的路径选...

Read More
2024-04-15 talkingdev

BabyLM挑战赛:探索用婴儿级数据训练顶级文本与视觉模型

近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...

Read More
2024-04-15 talkingdev

离散扩散实现:开源高效稳定训练代码

近期,一个名为“离散扩散实现”的项目在GitHub上引起了广泛关注。该项目提供了一种简洁的离散扩散算法实现方式,包含了众多最新的技术组件。这种新型算法不仅训练速度快,而且稳定性强,能够很好地适应各种复杂的数据...

Read More
2024-04-15 talkingdev

GPT引领人工智能新浪潮,初创企业受益匪浅

GPT(Generative Pre-trained Transformer)作为一种先进的自然语言处理技术,正逐渐成为人工智能领域的焦点。其最主要的价值在于极大地降低了初创企业使用机器学习功能的门槛。通过GPT,企业无需庞大的数据集或复杂...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page