漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-15 talkingdev

论文:无需训练即可对齐语言模型,效果提升至81%

对齐技术有助于使语言模型更有用且无害。虽然有时可能会损害性能,但总的来说,这是一项正面的技术。对齐是昂贵的,需要大量的对齐数据。然而,如果您允许模型在生成后评估自身的输出并进行回溯,它可以提高冻结模型...

Read More
2023-09-15 talkingdev

MLPerf结果强调了生成AI和存储的日益重要性

MLPerf发布了两个基准测试套件的结果:MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升,后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...

Read More
2023-08-31 talkingdev

CUDA图表助力深度学习模型性能提升,加速Llama 2速度达2.3倍

近日,一篇深度解析如何使用PyTorch 2.0的torch.compile和Nvidia CUDA图表功能提升深度学习模型性能的文章引起了广泛关注。该文章详细介绍了借助CUDA图表在Llama 2上实现了2.3倍的速度提升。这对于对性能敏感的AI从...

Read More
2023-08-11 talkingdev

论文:通过在上下文中学习提升Llama-2模型的性能

在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...

Read More
2023-08-01 talkingdev

论文:平衡多任务学习的新算法实现性能提升

在多任务学习中,任务之间的平衡至关重要。最新的研究提出了两种创新的可改进的间隙平衡算法,这些算法能动态调整任务权重以提升性能。这两种算法的出现,开启了多任务学习新篇章,对于多任务处理问题提供了新的解决...

Read More
2023-07-06 talkingdev

论文:增强视觉-语言零样本学习技术提升AI性能

这项研究提出了一种通过关注细节和关键词来改进AI对图像文本任务的理解的技术,提高了性能,特别是在面对未知情况时。

Read More
2023-04-09 talkingdev

Chrome发布WebGPU技术

Chrome浏览器现已默认支持WebGPU技术,可直接使用。WebGPU是一种新的Web图形API,它可以提供更灵活的GPU编程,同时还能访问WebGL无法提供的高级功能。它公开了现代硬件功能,允许在GPU上进行渲染和计算操作。WebGPU...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4