漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-27 talkingdev

Prompt Engineering Toolkit:Sonnet 3.5打造的高效提示词工具包

Prompt Engineering Toolkit是一个出色的提示工具包,其几乎完全由Sonnet 3.5制作。这个工具包能帮助测试不同提示的性能。在编程和开发中,提示工具包可提供程序员需要的各种信息,以帮助他们编写代码,增强代码的性...

Read More
2024-06-27 talkingdev

RES-Q-代码库编辑能力的新评估标准

RES-Q是一个全新的评估工具,专门用来评估大型语言模型在根据自然语言指令编辑代码库的能力。这个评估标准的出现,为开发者提供了一个全新的工具,可以更准确地评估和比较不同语言模型在代码编辑方面的性能。RES-Q的...

Read More
2024-06-27 talkingdev

论文:DeepMind通过联合样本选择进行数据策划,进一步加速多模态学习

在预训练中,如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本,仍然能匹配各种任务的最新技术。在这个过程中,他们采用了一种名为“联合样...

Read More
2024-06-27 talkingdev

论文:利用检索增强指令调整进行命名实体识别

检索增强指令调整(RA-IT)通过大型语言模型对信息进行提取,从而提高了信息提取的效率。这种技术的出现,为我们理解和处理大量信息提供了新的可能。RA-IT不仅可以提高信息提取的速度,还可以提高提取信息的准确性,...

Read More
2024-06-26 talkingdev

利用RAG使本地LLM语音助手更快更具扩展性

研究人员已经发现,通过分类数据、预计算嵌入以及动态生成示例,可以使LLM语音助手更加高效和可扩展。他们利用RAG(Retrieval Augmented Generation)系统对语音助手进行优化,提高了其性能和扩展性。RAG是一种典型...

Read More
2024-06-26 talkingdev

AI与Morph Labs联手优化信息检索增强型生成模型

近日,AI与Morph Labs联合发布了一篇关于信息检索增强型生成(RAG)模型微调的优秀博客文章。在文章中,他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型,它结合了信息检索技术...

Read More
2024-06-25 talkingdev

ParaLLM :Mac上基于MLX实现每秒1300个Token推理

在MLX中实施批量并行KV缓存,导致合成数据生成和模型完成的推理时间显著提速。这种新的技术实现方式大大加快了处理速度,从而在Mac上每秒可以处理1300个Token。这一突破性的技术进步,不仅可以提高处理效率,同时也...

Read More
2024-06-25 talkingdev

混合注意力MoA在大型语言模型中的应用

混合注意力(MoA)方法在大型语言模型中优化稀疏注意力,通过为不同的头部和层定制独特的稀疏注意力配置。该方法通过改变稀疏注意力的配置,使模型可以更有效地处理复杂的语言模型,从而提高模型的性能和效率

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page