GPT-3.5的相关内容 - 漫话开发者

2024-07-19 talkingdev

OpenAI推出新款小型模型GPT-4o Mini，颠覆GPT-3.5

OpenAI近日推出了一款新型小型模型——GPT-4o Mini，目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU（Mixed Multi-Level Understanding）上的得分为82，这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

2024-04-15 talkingdev

本文总结了专注于文本处理的初创公司Truss在过去六个月内发布数个基于大型语言模型（LLM）的功能中获得的七项宝贵经验。这些经验涵盖了如何改进提示方式、工具使用、GPT技术的最佳实践、以及GPT的局限性等方面。Trus...

2024-02-22 talkingdev

近期，AI领域的重大进展，特别是谷歌的Gemini提供了超过一百万标记的上下文窗口，以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的，这标志着AI应用迈入了实践时代，同时也凸显了领袖们理解和适应快速演变的AI应用...

2024-02-09 talkingdev

Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型，源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”，现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中，Smaug-72B胜过了已经成熟的模型，如GPT-3.5和...

2024-02-06 talkingdev

研究表明，经过调整的BERT模型在检测假新闻方面比通用的LLM模型（如GPT-3.5-turbo）更有效。BERT模型是一种预训练的自然语言处理模型，可用于各种文本任务。由于假新闻的传播日益严重，利用AI技术检测假新闻变得越来...

2024-01-10 talkingdev

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5（即使它可能是3倍大小）。有关模型训练，令牌计数，模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器，它使用自...

2023-11-01 talkingdev

据最新消息，Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码，在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器，可以用于编写各种程序代码。该模型采用...

2023-10-31 talkingdev

微软研究小组在一篇论文中提到，GPT-3.5-turbo（ChatGPT背后的模型）是一个具有20B参数的模型，该小组研究扩散模型用于代码。据称原始模型的参数为175B，因此可能进行了重新训练或蒸馏。