漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-24 talkingdev

自我奖励语言模型

本项目探讨了自我奖励语言模型,其中模型充当自己的评判者以改善训练。通过使用这种方法,研究人员能够提高模型的性能,超越像GPT-4这样的其他系统。

Read More
2024-01-23 talkingdev

GPT-4完成许多任务的人类水平熟练度,但并非完美

虽然GPT-4在许多任务上表现得熟练,但也存在一些奇怪的不足之处。例如,它可以说所有语言,但几乎无法做数学。随着人工智能变得更加有能力,该技术将对世界产生越来越大的影响。本文列出了人工智能可能影响世界的几...

Read More
2024-01-21 talkingdev

Codium开源基于AI的代码生成模型

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。

Read More
2024-01-20 talkingdev

GPT-4对Mixtral进行微调

Mixtral是一款人工智能软件,可用于数据处理和分析。使用GPT-4对其进行微调,可以快速降低其使用成本。GPT-4是最新一代的自然语言处理模型,具有更高的性能和更广泛的应用场景。在测试中,Mixtral与GPT-4的结合效果...

Read More
2024-01-20 talkingdev

TACO:代码生成新基准开源

TACO是一个新的基准,用于评估系统生成代码的能力。它比现有数据集大得多,包含更具挑战性的问题。在简单的问题上,GPT-4的正确率达到30%,而在最难的问题子集上,它仅能达到2%。

Read More
2024-01-15 talkingdev

探秘GPT-4的隐藏性变化

最近对ChatGPT的GPT-4接口进行的更改,显著地改变了模型的网络浏览工具。这些更改阻止了模型直接引用网页上的引用,并限制了完整内容的查看。本文分析了GPT-4网络浏览的基本机制、隐藏的变化及其影响。OpenAI越来越...

Read More
2024-01-12 talkingdev

OpenAI推出ChatGPT Team订阅计划,专为小团队打造

OpenAI推出了ChatGPT Team,这是一项新的订阅计划,针对最多149名成员的小团队提供AI聊天机器人服务。该计划提供专用工作区、访问OpenAI的最新模型(包括GPT-4和DALL-E 3)、文件分析工具以及无需编码经验即可创建定...

Read More
2024-01-12 talkingdev

GPT-4 Turbo的基准测试结果

最近的基准测试显示,GPT-4成功完成了70%的编程任务,而GPT-4 Turbo略微落后,仅达到了68.8%。有趣的是,GPT-4 Turbo需要更多的第二次尝试,这表明它可能缺乏GPT-4的记忆能力。随后的测试证实了这一点。

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page