漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

AnimateAnyone 开源视频控制模型复现成功

AnimateAnyone 是一款非常优秀的视频控制模型,它接受图像和骨架动作作为输入,然后将人物动画应用到控制图像上。这个开源仓库是对这项工作的复现,它实现了 AnimateAnyone 的主要功能,并在开发者社区中广受好评。

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
2024-01-16 talkingdev

Surya开源,多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...

Read More
2024-01-15 talkingdev

MiniMA项目开源:高效压缩的语言模型

MiniMA项目致力于将大型语言模型压缩成小型学生模型的挑战。研究人员发现了不同学生模型的一致最优容量差,并利用这一发现创建了MiniMA,它是从一个7B教师模型中压缩出来的3B模型。MiniMA在效率和性能方面创造了新的...

Read More
2024-01-15 talkingdev

Triplit开源:实时同步浏览器与服务器数据的数据库

Triplit是一个能够实现实时同步浏览器与服务器数据的数据库。通过Triplit,用户可以快速创建实时应用程序。Triplit提供了一种简单的方式来管理数据,并在浏览器和服务器之间同步数据。Triplit还提供了一个易于使用的...

Read More
2024-01-12 talkingdev

开源Chatbot聊天UI库发布

近日,一家面向开发者的互联网公司开源了一个Chatbot UI库,旨在为开发者提供在其应用程序中构建聊天UI的解决方案。此库可用于构建人工智能聊天机器人,使用户可以与应用程序进行更加自然的交互。基于React,此库易...

Read More
2024-01-12 talkingdev

论文:TechGPT-2.0在知识图谱构建中的应用

近日,技术领域的新闻人士表示,TechGPT-2.0在知识图谱构建中的应用取得了重大进展。该项目专注于命名实体识别和关系三元组提取,为大型语言模型的特定任务增添了新的功能。该项目的成功也标志着中国开源人工智能社...

Read More
2024-01-11 talkingdev

谷歌开源1.6T MoE模型

谷歌的开关Transformer是最早成功的专家混合模型之一。现在,该模型的代码已经在HuggingFace平台上发布,供人们使用。

Read More
  1. Prev Page
  2. 54
  3. 55
  4. 56
  5. Next Page