漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

OpenRLHF开源,提供基于Ray的RLHF实现

近日,GitHub上有一个新的仓库OpenRLHF发布了。这是一个基于Ray的RLHF实现,专为Llama样式模型设计。该仓库集成了多种PPO稳定技巧,以提高性能。Ray是一款新型的分布式计算框架,它具有高效、易用等特点,支持快速构...

Read More
2024-02-21 talkingdev

控制向量库开源,轻松地实现语义生成

控制向量(ControlVectors)是一种廉价的语义生成输出控制方法。它们的训练比LoRA更便宜,但仍然可以非常有效。这个控制向量库使得使用这种技术更加简单。控制向量库是由一群开发人员推出的,作为一项开源项目,它的代...

Read More
2024-02-20 talkingdev

Minbpe开源的语言模型分词器

Karpathy发布了一个最小化、干净、可扩展的实现字节对编码的语言模型分词器,Minbpe现已在GitHub Repo中开放。

Read More
2024-02-20 talkingdev

OpenMathInstruct-用LLMs提高数学技能

研究人员创建了OpenMathInstruct-1,这是一个用于训练开源大型语言模型数学的新数据集,可与闭源模型的性能相匹配。这一突破包含180万个问题解决对,为更加可访问和有竞争力的数学教学AI工具打开了大门。

Read More
2024-02-20 talkingdev

htmz:极简HTML微框架开源

htmz是一款极简的HTML微框架,可用于创建动态Web用户界面。它允许开发人员在页面中的任何元素中加载HTML资源。htmz只需要一个内联HTML片段即可工作-无需依赖项,也不需要后端。

Read More
2024-02-19 talkingdev

RoCo-开源高效LLM新策略

GitHub近日开源了一项名为RoCo的新策略,该策略旨在提高LLM在有限资源环境下的效率。RoCo是一种强大的缓存遗漏策略,可以帮助用户更好地使用LLM。该政策的发布将有助于优化机器学习应用的性能,提高效率。RoCo的开源...

Read More
2024-02-19 talkingdev

Cohere For AI发布Aya,覆盖100多种语言的LLM

Cohere的非营利研究实验室C4AI发布了一个名为Aya的模型,这是一个新的最先进的开源大规模多语言研究LLM,涵盖101种语言,包括50多种以前未得到服务的语言。

Read More
2024-02-19 talkingdev

NeuralFlow开源-神经流中间层输出的可视化

NeuralFlow神经流是一个Python脚本,用于绘制Mistral 7B的中间层输出。它产生一个512 x 256的图像,表示模型的每一层的输出。

Read More
  1. Prev Page
  2. 42
  3. 43
  4. 44
  5. Next Page