漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-11 talkingdev

多视角图像生成技术 ViewFusion

近日,研究人员提出了一种名为 ViewFusion 的新算法,旨在改善扩散模型从新的视角生成图像的方式,确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时,往往会产生不一致性,导致图像质量下降。ViewFu...

Read More
2024-03-11 talkingdev

大型语言模型中的优化算法metaheuristics引入,有效优化prompt学习

本文介绍了元启发式算法,这是一种强大的工具,可用于改善大型语言模型中的prompt学习。元启发式算法是一组多样化的超过100种离散优化方法,可以大大提高大型语言模型的效率和性能。

Read More
2024-03-11 talkingdev

加州大学三位研究者取得新突破,矩阵乘法更接近理想状态

来自加州大学的三名研究者提出了一种新技术,可以提高矩阵乘法的效率。矩阵乘法是一种基本的计算操作,被广泛应用于人们日常使用的各种算法中。即使是微小的提高,最终也可能带来显著的时间、计算能力和金钱上的节省...

Read More
2024-03-07 talkingdev

从零开始培训LLMs的初创公司

一家名为LLMify的初创公司正在推出一种新的方法来训练语言模型,他们将在没有预训练模型的情况下从零开始培训LLMs。该公司的创始人表示,这种方法可以提高模型的准确性和适用性,并加快训练时间。该公司已经引起了一...

Read More
2024-03-04 talkingdev

Summarize-用AI在一分钟内获取YouTube视频摘要

Summarize.ing是一款使用人工智能技术的产品,可以在一分钟内为YouTube视频生成摘要。这款产品可以帮助用户快速了解视频内容,不必花费大量时间观看整个视频。Summarize.ing使用基于深度学习的算法来分析视频内容,...

Read More
2024-02-27 talkingdev

Meta开源生产环境强化学习库

Meta最近发布了一款名为Pearls的强化学习库,该库已经在拍卖竞标系统、推荐引擎等应用中进行了部署,可以用于研究和部署。Pearls提供了一些在强化学习领域中非常实用的工具,例如,一些用于环境模拟和数据前处理的工...

Read More
2024-02-27 talkingdev

论文:简单的强化学习算法战胜PPO

REINFORCE是一种简单、标准且易于理解的强化学习方法。然而,在模拟器中使用它很难稳定地进行训练。PPO在一般情况下更为高效和稳定。Gemini使用REINFORCE算法,而据信GPT-4使用PPO算法

Read More
2024-02-26 talkingdev

基于标注数据的LLM评估指标

本文讨论依赖于真实标注数据的评估指标。它探讨了通用和RAG特定的评估指标。所有指标都带有Python实现或指向一个Hugging Face模型卡的链接。

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page