漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-13 talkingdev

Transformer Debugger: 为小型语言模型提供自动可解释性技术支持

Transformer Debugger是一种工具,它通过将自动可解释性技术与稀疏自动编码器相结合,支持对小型语言模型的特定行为进行调查。

Read More
2024-03-11 talkingdev

Axolotl开源,本地GPU上训练大模型取得突破

上周,在小型GPU上训练大型模型取得了突破。这个配置展示了如何使用这些技术在消费级硬件上训练Mixtral。

Read More
2024-03-11 talkingdev

Hatchet:开源队列和发布/订阅系统,解决并发性等问题

Hatchet是GitHub开源的代码库,可以帮助开发者更好的设计耐用的工作负载,解决传统队列和发布/订阅系统所带来的一系列问题,如并发性、公平性和速率限制等。Hatchet通过对任务进行分组,并使用定时器和状态机等技术...

Read More
2024-03-08 talkingdev

Fructose: 基于LLM调用的可靠强类型接口

近期,开源社区发布了一个名为Fructose的Python包,其主要用途是为LLM调用创建可靠强类型接口。 Fructose是一个轻量级Python包,它可以帮助开发人员避免与LLM交互时的一些常见错误,例如类型不匹配或缺失参数。通过...

Read More
2024-03-08 talkingdev

CoLLM-通过协作提高LLM性能

Co-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。

Read More
2024-03-07 talkingdev

MobileClip:快速文本和图像生成模型

MobileClip是一个快速的文本和图像模型,与OpenAI的原始CLIP模型性能相同,但运行速度提高了7倍。它可以在设备上用于各种视觉和语言任务。

Read More
2024-03-06 talkingdev

增强图像恢复技术开源

近日,一项名为“双域条纹注意机制”的新技术在Github上发布,该技术极大地改善了图像恢复任务。传统的图像恢复方法对于纹理丰富的图像效果不佳,而这项新技术可以更好地保留图像细节和纹理信息。它通过使用双域条纹注...

Read More
2024-03-06 talkingdev

Claude 3 Opus视频摘要技术开源

最近,知名机器学习专家Andrej Karpathy提出了一个具有挑战性的任务:从他最近的一段视频中提取摘要并发布博客文章。经过一些数据预处理,Claude 3成功地完成了这项任务,并发布了一篇高质量有趣的博客文章。Claude...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page