漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-25 talkingdev

开源RPG框架,改进文本到图像生成质量

最近,由阿里达摩院、南京邮电大学、南京大学等机构合作开发的RPG框架在GitHub上开源。该框架采用“Recaption、Plan和Generate”的方法来改进文本到图像生成,将复杂的图像创建任务分解为更简单的任务,从而在处理多个...

Read More
2024-01-25 talkingdev

Nano ColBERT:最新开源检索嵌入模型

ColBERT是用于检索的较好的嵌入模型之一。由于许多人正在构建启用RAG的人工智能应用程序,因此值得探索和使用。这个实现是一个简单和直接的复制,没有性能优化和它们所增加的复杂性。它使用HuggingFace的BERT,但实...

Read More
2024-01-25 talkingdev

论文:对比优化偏好技术在机器翻译中的应用

对比偏好优化(CPO)是一种新的优化技术,现在应用于机器翻译。与DPO相比,CPO在数据效率方面更高。重要的是,该目标函数防止模型提出合理但不准确的翻译,从而使模型在WMT上取得了有竞争力的表现。

Read More
2024-01-22 talkingdev

Stablecode3B:比7B的CodeLlama更出色,可在MacBook上本地运行

据悉,最近发布的Stablecode 3B模型表现出色,其强大的性能超过了7B的CodeLlama模型。同时,该模型的尺寸足够小,能够在MacBook上本地运行,无需像7B模型一样需要大量的计算资源。这一模型的发布,标志着技术领域的...

Read More
2024-01-21 talkingdev

CPO策略提高翻译语言模型的能力

该项目提出了对比优化策略(CPO),以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型,解决了监督微调的局限性,并取得了改进。CPO策略通过对模型的预训练进行增量式微调,有助于提高机器翻译...

Read More
2024-01-15 talkingdev

论文:语言模型对提示词敏感研究

最近的研究表明,根据提示对模型进行少量训练,可以在任务上达到4-88%的准确率。这项研究展示了如何科学地改进您的提示,从而提高模型的准确性。这项技术对于自然语言处理领域的未来具有重要意义。

Read More
2024-01-12 talkingdev

Unsloth轻量化库加速TRL上的模型

Unsloth是一个轻量化库,可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型,使得模...

Read More
2024-01-11 talkingdev

论文:谷歌研究人员提出自我对弈优化算法,致力于简化AI对齐

谷歌研究人员提出了一种名为Self-Play Preference Optimization (SPO) 的自我对弈优化算法。该算法相比传统的强化学习对齐方式更加简单。研究人员运用博弈论,找到了对噪声干扰鲁棒性强、性能表现优异的单人自我对弈...

Read More
  1. Prev Page
  2. 36
  3. 37
  4. 38
  5. Next Page