漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

Surya开源,多语言OCR工具包提供准确的文本检测

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型,并已在GitHub上开源发布。该模型可以识别多种语言,包括中文、英文、法文、德文和印地文等,并且可以在不同的...

Read More
2024-01-08 talkingdev

苹果公司将在WWDC上推出一系列基于生成式AI的新工具

据报道,作为iOS 18的一部分,苹果计划在WWDC上宣布一系列基于生成式AI的新工具。这些新工具将包括Siri的改进版本、Xcode的新版本以及Apple Music中用于自动创建播放列表的工具。该技术还将用于解决AppleCare的问题...

Read More
2023-12-20 talkingdev

Amphion-开源多媒体资源生成工具包

Amphion是一款新的媒体生成工具包,支持音乐和语音,并且团队正在努力添加更多的模型。该工具包基于开源技术,可自由使用和修改。

Read More
2023-11-14 talkingdev

Tarsier开源,基于视觉交互的Web Agent

随着强大的新视觉模型的出现,许多团队正在尝试构建使用视觉与Web元素交互的代理程序。Tarsier工具包介绍了一套标准工具(例如元素标记),您可以使用任何视觉系统来理解网页并执行操作。它还包括用于非视觉语言模型...

Read More
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-07 talkingdev

xAI推出PromptIDE开发环境

xAI的PromptIDE是一个用于提示工程和可解释性研究的开发环境。PromptIDE是一个为AI开发人员和研究人员提供的全面的可解释性工具,旨在帮助他们更好地理解和管理AI系统。该工具包括强大的可视化和分析功能,可以帮助...

Read More
2023-11-03 talkingdev

用于RAG、微调和模型服务的开源工具包

最近,一家开发团队发布了一个名为“LLM Toolkit”的开源Python工具包,用于构建基于RAG的语言模型生成应用程序。它提供了快速的RAG微调、模型训练和服务脚本,同时支持多种文本数据输入和输出格式。该工具包的代码已...

Read More
2023-10-24 talkingdev

人工智能应用的产品都长这样

人工智能的兴起导致了创业公司的过度饱和,其中一些公司仅凭借一个宣传文案就筹集了大量资金,这可能表明了市场的过度炒作和高估。专家警告说,并非所有的创业公司都是创新者;许多公司只是在模仿。AI品牌和实用工具...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page