漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-25 talkingdev

使用SAM模型进行3D医学影像分割

SAM-Med3D是Segment Anything Model(SAM)的升级版,专门针对3D医学影像进行了优化。虽然原始的SAM在处理3D医学影像时存在困难,但是经过对超过131K个3D掩模的广泛数据集进行训练的SAM-Med3D在捕捉3D空间细节方面使...

Read More
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More
2023-10-23 talkingdev

SoM开源,多模态语言模型的新进展

多模态语言模型(multimodal language models)的发展正日益成熟。最近,一种名为State of Mark prompting的方法在GitHub Repo上引起了广泛关注。该方法首先使用Segment Anything算法对图像进行处理,对检测到的类别...

Read More
2023-10-19 talkingdev

ChatGPT系统提示指南

系统提示可以改变基于ChatGPT的语言模型的行为。这个代码仓库包含一些非常好的系统提示,可以根据您的偏好改善可用性。

Read More
2023-10-18 talkingdev

Softr AI推出新产品,打造无代码应用开发新体验

Softr AI近日推出了一款新产品,利用单个提示即可轻松构建应用程序!无论是企业内部网、客户门户或内部工具,用户只需提供少量信息,即可创建出完全功能的Web应用程序。Softr AI的新产品将无代码应用开发带入新的层...

Read More
2023-10-18 talkingdev

微软关联研究发现GPT-4存在缺陷

微软附属的研究论文发现,尽管GPT-4总体上比GPT-3.5更可靠,但可以通过特定的“越狱”提示更容易地操纵其产生有毒和偏见内容。

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-16 talkingdev

Google推出AI智能搜索体验,从文本搜索生成图像

谷歌的搜索生成体验现在可以让你从文本提示中创建图像。该功能使用人工智能技术,可以根据你输入的文本提示,自动生成与文本内容相关的图像。这项功能可以帮助用户更快速地找到所需的图像,也可以提高用户的搜索效率...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page