漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-29 talkingdev

1比特语言模型:后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...

Read More
2024-03-29 talkingdev

Hume推出情感语音界面 引领人工智能新趋势

Hume公司近日发布了一项创新产品——情感语音界面(Empathic Voice Interface,简称EVI),这是首款集成了情感智能的对话式人工智能技术。EVI能够理解和模拟人类情感,通过语音交互提供更为自然、贴心的用户体验。这一...

Read More
2024-03-29 talkingdev

AI21发布Jamba语言模型,性能超越Transformers

AI21实验室近日发布了一款新型语言模型——Jamba,它采用了独特的模型结构,旨在实现比Transformers更高的效率,同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE(Mixture of Experts)层,这使...

Read More
2024-03-29 talkingdev

阿斯顿大学实现光纤系统未用波段 传输速度提升450万倍

英国阿斯顿大学的研究团队通过利用光纤系统中尚未使用的波长带,成功实现了每秒301太比特的互联网数据传输速度。这一创纪录的速度是现有最快的光纤网络的450万倍,有望彻底改变未来互联网通信的面貌。此次技术的突破...

Read More
2024-03-29 talkingdev

未来GPU将如何实现万亿晶体管:探索高效能AI的无限可能

人工智能的近期成就归功于三个主要因素:高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度,行业需要更为强大的设备。在过去的五十年中,行业一直专注于晶...

Read More
2024-03-28 talkingdev

OpenAI 测试 GPT 收益分享模式

OpenAI 正在与一小群美国开发者合作,测试基于使用的 GPT 收益分享模式。这种模式可能会改变开发者与 OpenAI 之间的收益分配方式,从而激励更多的创新和贡献。测试的目标是探索如何更好地支持开发者社区,并推动 GPT...

Read More
2024-03-28 talkingdev

OPTIN框架:无需额外训练提升AI模型效率

OPTIN框架是一个创新的方法,用于提高基于变换器的AI模型在各个领域的效率,而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术,可以在特定约束下压缩网络,同时几乎不影响其准确性。通过这种方法,可以...

Read More
2024-03-28 talkingdev

通过街头霸王游戏测试基准语言模型

语言模型(LLMs)的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

Read More
  1. Prev Page
  2. 33
  3. 34
  4. 35
  5. Next Page