漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

OpenAI推出新款小型模型GPT-4o Mini,颠覆GPT-3.5

OpenAI近日推出了一款新型小型模型——GPT-4o Mini,目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU(Mixed Multi-Level Understanding)上的得分为82,这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

Read More
2024-04-15 talkingdev

初创公司Truss分享使用GPT技术的七大经验教训

本文总结了专注于文本处理的初创公司Truss在过去六个月内发布数个基于大型语言模型(LLM)的功能中获得的七项宝贵经验。这些经验涵盖了如何改进提示方式、工具使用、GPT技术的最佳实践、以及GPT的局限性等方面。Trus...

Read More
2024-02-22 talkingdev

AI应用步入实践时代,巨头们需紧跟时代发展

近期,AI领域的重大进展,特别是谷歌的Gemini提供了超过一百万标记的上下文窗口,以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的,这标志着AI应用迈入了实践时代,同时也凸显了领袖们理解和适应快速演变的AI应用...

Read More
2024-02-09 talkingdev

Smaug-72B:开源AI模型的新王者

Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型,源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”,现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中,Smaug-72B胜过了已经成熟的模型,如GPT-3.5和...

Read More
2024-02-06 talkingdev

优秀演员还是一般演员:利用LLM检测假新闻

研究表明,经过调整的BERT模型在检测假新闻方面比通用的LLM模型(如GPT-3.5-turbo)更有效。BERT模型是一种预训练的自然语言处理模型,可用于各种文本任务。由于假新闻的传播日益严重,利用AI技术检测假新闻变得越来...

Read More
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo,参数达到20B

微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page