漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-09 talkingdev

对比激活下的Steering Llama 2技术

有很多方式可以对齐语言模型,例如SFT、LoRa、RLHF、DPO、Prompting和Threatening。本研究提出使用负嵌入加到偏置项中,以将模型生成推向期望的结果。

Read More
2023-11-28 talkingdev

ZipLoRA: 低秩学习矩阵合并技术提升模型性能

本文介绍了一种名为 ZipLoRA 的技术,该技术可以将多个低秩学习矩阵(LoRAs)合并在一起,从而改善模型性能。相比于常规的微调,LoRAs 更加经济实惠,但是也会改变模型的行为。本文提出的 ZipLoRA 技术可以在保留每...

Read More
2023-11-15 talkingdev

LLaMA模型的增强:引入泰米尔语令牌

经过增强的LLaMA模型现已包含16,000个泰米尔语令牌,利用了LoRA方法进行高效训练。这个更新,连同Alpaca和OpenOrca数据集的新的泰米尔语版本,显著改进了泰米尔语文本处理,为印度语言人工智能的未来发展铺平了道路...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
2023-11-10 talkingdev

Punica:运行多个LoRA精细调整模型的利器

Punica是一个开源的Python库,旨在降低使用LoRA精细调整模型的成本。LoRA是一种用于低功耗、远距离通信的无线电调制技术。在使用LoRA进行通信时,需要对模型进行精细调整以获得最佳性能。Punica可以同时运行多个精细...

Read More
2023-10-20 talkingdev

Hugging Face Space推出万圣节LoRA照相亭

Hugging Face Space推出了一款万圣节LoRA照相亭,用户可以通过使用Stable Diffusion将自己的照片变成一个可怕的万圣节主题角色。这款照相亭是基于人工智能技术的,能够通过对照片的处理实现各种特效效果。此外,用户...

Read More
2023-10-18 talkingdev

关于LoRA 微调的几点洞见想法

最近,一组研究人员针对数百个实验结果,总结出了微调 LoRA 的几点洞见。研究人员发现,针对特定场景进行细致的参数调整可以显著提升 LoRA 的性能,同时,合理的信道选择和传输功率也是提高 LoRA 传输可靠性的关键。...

Read More
2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法,让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page