漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-21 talkingdev

OpenAI 有望在几个月内发布 GPT-5

据最新消息,人工智能研究实验室 OpenAI 计划在今年夏季发布其语言预测模型的最新迭代版本 GPT-5。继 GPT-4 之后的 GPT-5 有望在性能上实现质的飞跃,为自然语言处理和机器学习领域带来新的突破。尽管官方尚未透露具...

Read More
2024-03-21 talkingdev

Quora首席执行官Adam D'Angelo谈如何将AI普及化

在这次采访中,Quora的首席执行官Adam D'Angelo探讨了如何通过为内容创作者建立基础设施来实现人工智能的民主化。采访涵盖了社交网络如何补充AI、多模型和多模态AI的概念、如何将AI技术普及给大众、为创作者提供AI基...

Read More
2024-03-21 talkingdev

GPT-5或于今年夏季发布,预计将大幅升级ChatGPT

据报道,OpenAI计划在今年2024年夏季发布一个重要的人工智能模型,可能是GPT-5。这个新模型预计是一个多模态大型语言模型,其功能与GPT-4相似,但性能更为优秀。目前,OpenAI仍在对该模型进行训练,训练完成后将进行...

Read More
2024-03-19 talkingdev

苹果研究团队在多模态人工智能领域取得重大突破

苹果公司的研究团队近期在人工智能领域实现了创新性进展,他们开发出了一种能够在文本和图像上同时训练大型语言模型的方法。这一成就推动了多模态AI任务在性能上的显著提升,达到了艺术级水平。所谓多模态AI,指的是...

Read More
2024-03-07 talkingdev

稳定扩散 3:研究论文

稳定扩散 3 通过其新颖的多模态扩散转换器架构,通过文本和图像的分别处理权重,提高了提示理解和排版,优于领先的文本到图像模型,为AI生成的视觉内容带来了进步。

Read More
2024-03-06 talkingdev

Anthropic发布Claude 3家族的三个新模型,最强模型匹敌GPT4

Anthropic最近发布了Claude 3家族的三个新模型,其中最强的模型匹敌了GPT4的报告基准结果。此外,这是一个多模态模型,对视觉任务表现良好。值得注意的是,Claude的编码能力在此版本中得到了显著提高。

Read More
2024-03-01 talkingdev

论文:PromptMM使用LLM知识蒸馏的在线购物推荐系统

PromptMM是一种使用多模态知识蒸馏的在线购物推荐系统,可以改善像亚马逊和TikTok这样的平台上的推荐系统。它通过从各种内容类型(视觉、文本或声音)中蒸馏出重要特征,来解决用户偏好的不准确性,并简化系统,以防...

Read More
2024-03-01 talkingdev

论文:AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈,并创建了Q-Pathway数据集,以分析其清晰度、色彩和亮度。

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page