创新的相关内容 - 漫话开发者

2024-03-29 talkingdev

1比特语言模型：后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下，对语言模型中的线性层进行量化处理，实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型，...

2024-03-29 talkingdev

Hume公司近日发布了一项创新产品——情感语音界面（Empathic Voice Interface，简称EVI），这是首款集成了情感智能的对话式人工智能技术。EVI能够理解和模拟人类情感，通过语音交互提供更为自然、贴心的用户体验。这一...

2024-03-29 talkingdev

AI21实验室近日发布了一款新型语言模型——Jamba，它采用了独特的模型结构，旨在实现比Transformers更高的效率，同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE（Mixture of Experts）层，这使...

2024-03-29 talkingdev

英国阿斯顿大学的研究团队通过利用光纤系统中尚未使用的波长带，成功实现了每秒301太比特的互联网数据传输速度。这一创纪录的速度是现有最快的光纤网络的450万倍，有望彻底改变未来互联网通信的面貌。此次技术的突破...

2024-03-29 talkingdev

人工智能的近期成就归功于三个主要因素：高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度，行业需要更为强大的设备。在过去的五十年中，行业一直专注于晶...

2024-03-28 talkingdev

OpenAI 正在与一小群美国开发者合作，测试基于使用的 GPT 收益分享模式。这种模式可能会改变开发者与 OpenAI 之间的收益分配方式，从而激励更多的创新和贡献。测试的目标是探索如何更好地支持开发者社区，并推动 GPT...

2024-03-28 talkingdev

OPTIN框架是一个创新的方法，用于提高基于变换器的AI模型在各个领域的效率，而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术，可以在特定约束下压缩网络，同时几乎不影响其准确性。通过这种方法，可以...

2024-03-28 talkingdev

语言模型（LLMs）的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...