漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-30 talkingdev

Roboflow开源适用于多模态模型的提示库

标记提示集是一种聪明的方法,可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制,并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

Read More
2023-11-30 talkingdev

Tanuki:轻松构建LLM技术驱动的应用,让应用变得更便宜、更快速

LLM是一种全新的机器学习技术,可以让应用程序在运行时不断学习和优化,从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具,可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

Read More
2023-11-30 talkingdev

llamafile:运行在多个CPU微架构上的单文件分发工具

近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

Read More
2023-11-29 talkingdev

Stable Video Diffusion发布,AI模型全面升级

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

Read More
2023-11-29 talkingdev

Agency,探索生成式AI开源工具

一家开发者工具提供商发布了一款针对LLM和其他生成式人工智能的库,旨在为开发者提供高效、易用的Go语言编程接口,助力开发者挖掘这一领域的潜力。该库名为Agency,由一家技术公司在GitHub上维护。该库的设计目标是...

Read More
2023-11-29 talkingdev

图像转绘画技术研究突破开源

研究人员开发了一种新技术,可以将图像转换为绘画,呈现出与人类类似的质量和风格。这项技术基于深度学习算法,使用神经网络来分析图像的内容和结构,并模仿人类绘画的风格和技巧。经过训练,该技术可在保留原始图像...

Read More
2023-11-29 talkingdev

360度全景成像混合技术实现开源

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。

Read More
2023-11-28 talkingdev

KskyVideo-文本到视频生成技术开源

Kandinsky Video采用双阶段文本到视频生成技术。首先,它通过关键帧来勾勒视频的故事情节,然后平滑过渡和移动,大大提高了视频质量并降低了计算要求。

Read More
  1. Prev Page
  2. 62
  3. 63
  4. 64
  5. Next Page