漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-11 talkingdev

Flameshot – 简洁的开源截图软件

Flameshot是一个流行的开源截图工具,可以轻松地在Linux和Windows上截取屏幕。它允许用户添加注释、箭头、线条和形状等元素到截图中,并支持自定义快捷键。Flameshot的界面简洁明了,易于使用,并且具有许多高级功能...

Read More
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
2024-05-14 talkingdev

Pico:用于流量传输的开源Ngrok替代品

Pico是一款开源的Ngrok替代品,用于传输生产流量。与Ngrok不同的是,Pico可以在本地部署,因此更加安全和稳定。Pico支持TCP和HTTP隧道,可以将本地端口映射到公网上。此外,Pico还支持自定义域名和HTTPS加密传输。Pi...

Read More
2024-05-07 talkingdev

LeroBot:HF团队开源机器人开发工具库

知名的人工智能研发团队Hugging Face近日发布了一个新的项目,该项目将机器人开发所需的常用工具进行了优雅的打包。这个新的项目在Github上开源,全球的开发者都可以免费使用和贡献。Hugging Face团队一直致力于AI领...

Read More
2024-03-26 talkingdev

PSALM:面向图像分割任务的多模态模型扩展

PSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...

Read More
2024-03-18 talkingdev

MusicLang:用API和模型生成音乐的开源工具

MusicLang是一个新兴的API和模型集合,旨在为开发者和音乐爱好者提供生成音乐的功能。通过这一工具,用户可以轻松地创造出独特的旋律和和谐音乐。MusicLang的灵活性和易用性使其成为音乐创作和实验的理想选择,无论...

Read More
2024-03-18 talkingdev

pg_hint_plan:为PostgreSQL执行计划优化提供新策略

开源项目pg_hint_plan为开发者提供了一种新的方法,通过在SQL注释中使用提示来调整PostgreSQL的执行计划。在PostgreSQL中,规划器通过成本基优化器估算每个可能的执行计划的成本,并执行成本最低的计划。尽管Postgre...

Read More
2024-03-08 talkingdev

深入探讨:大规模模型训练的并行化技术

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术,以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术,并详细讨论了它们的优缺点。...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page