GPT-4的相关内容 - 漫话开发者

2024-03-05 talkingdev

特斯拉CEO马斯克起诉OpenAI

特斯拉CEO马斯克起诉OpenAI，声称GPT-4构成AGI，不再受限于与微软的协议。他还主张更多的透明度和公开性。OpenAI是人工智能研究公司，由马斯克等人创立。该公司的GPT-3模型在自然语言处理领域取得了重要进展，但也引...

2024-03-05 talkingdev

Anthropic的Claude 3似乎在一系列认知任务上树立了新的行业标准。该公司声称，在某些情况下，它接近于“人类水平”的能力。Claude 3有三个模型：Claude 3 Haiku，Claude 3 Sonnet（为Claude.ai聊天机器人提供动力）和C...

2024-03-01 talkingdev

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈，并创建了Q-Pathway数据集，以分析其清晰度、色彩和亮度。

2024-02-28 talkingdev

法国AI初创公司Mistral宣布推出新的API模型，并与Azure达成合作。Mistral Large在多语言任务方面表现出色，在MMLU上仅比GPT-4差了几个百分点，性能强大。该初创公司还在其API中添加了一个新的mistral-small模型。

2024-02-27 talkingdev

OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder，通过训练合成多轮数据集和使用人类反馈，能够在编程HumanEval基准测试中获得85%以上的准确率。

2024-02-27 talkingdev

REINFORCE是一种简单、标准且易于理解的强化学习方法。然而，在模拟器中使用它很难稳定地进行训练。PPO在一般情况下更为高效和稳定。Gemini使用REINFORCE算法，而据信GPT-4使用PPO算法。

2024-02-27 talkingdev

Mistral AI推出了一款名为Mistral Large的新型语言大模型，以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务，以与ChatGPT竞争。通过该公司的API，访问Mistral Large的成本为每百万输入令...

2024-02-26 talkingdev

MMedLM 2是一种开创性的多语言语言模型，专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中，MMedLM 2的表现优于其他模型，包括GPT-4。