漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-20 talkingdev

机器学习:使用视觉指令调整大型语言模型

本文介绍了一篇新的论文,提出使用机器生成的指令跟踪数据来调整大型语言模型(LLMs)以执行多模态任务。该论文开发了LLaVA,这是一个大型多模态模型,它结合了视觉编码器和仅限于语言的GPT-4。经过调整后,LLaVA展...

Read More
2023-04-19 talkingdev

微软开发自己的AI芯片,将与Nvidia竞争

据报道,微软正在开发用于训练大型语言模型的AI芯片。这些芯片自2019年以来一直在秘密开发中。目前正在使用大型语言模型进行测试,例如GPT-4。Nvidia制造的芯片需求量很大,Nvidia最新的H100 GPU在eBay上的售价超过...

Read More
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-17 talkingdev

自主AI代理人的热度不断上升,GPT-4输出循环

新闻内容: - Agentic实现是尝试循环和迭代AI模型以尽可能少的人类干预来执行多步任务的尝试。 - 链接AI模型可能使它们比使用单个AI模型更有能力。Auto-GPT和BabyAGI等项目旨在在获得一般方向后执行任务。 - 这些项...

Read More
2023-04-14 talkingdev

开源聊天机器人 Vicuna 击败 GPT-4 与 ChatGPT 相当

这篇论文介绍了 Vicuna-13B,一个利用 LLaMA 对用户分享的对话进行微调训练的开源聊天机器人。在超过 90% 的情况下,Vicuna-13B 的表现优于其他模型,如 LLaMA 和 Stanford Alpaca,并且在与 OpenAI ChatGPT 和 Goog...

Read More
2023-04-13 talkingdev

科技代理人

近期社区中,越来越多的人认可了语言模型作为工具规划者的想法(这些工具可能是其他语言模型)。本质上,将中央强大的语言模型(如GPT-4)授权访问一组工具。这些工具可以是网络搜索、文档、Python引擎,以及本例中...

Read More
2023-04-12 talkingdev

开发者通过AI创造了“自愈”程序

一位开发者创造了一款名为“狼人”的程序,它可以赋予Python程序再生能力。它使用GPT-4来编辑脚本,并解释程序崩溃的原因。狼人会持续运行脚本,直到所有问题都被修复。此外,该程序的GitHub库链接也在文章中提供。...

Read More
2023-04-11 talkingdev

ChatSpot 3 发布,搭载 GPT-4

ChatSpot 发布了 Alpha 3 版本,该版本采用 GPT-4 技术,带来了众多改进。以下是三个核心点: - ChatSpot 可以处理高达 32,000 个标记,提供了新的提示库。 - ChatSpot 现在可以生成公开文章的摘要,并支持 HubSpot...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22