漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-23 talkingdev

结合无监督训练和监督微调的效果存在挑战

近日,一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明,在初始训练中使用更先进的模型(如GPT-4)可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上,供科研人员使用和参考...

Read More
2024-02-23 talkingdev

Reddit与AI公司签订新的训练协议,出售用户内容

Reddit已经与一家未透露姓名的大型AI公司签订了一份价值约6000万美元的许可协议,授权该公司可以访问Reddit大量的用户生成内容。Reddit表示,这项协议将帮助AI公司培训其算法,从而提高其在自然语言处理和语音识别等...

Read More
2024-02-23 talkingdev

斯坦福发布HELM Instruct基准测试

斯坦福大学语言建模团队发布了一项广泛使用的基准测试,名为Holistic Evaluation of Language Models (HELM)。他们还发布了一份面向指令跟随的版本,名为HELM-Instruct。该测试是多维的、开放式的和绝对的。

Read More
2024-02-22 talkingdev

新LLM基准发布:GPT-4表现超前于其他基准

知名研究员Nicholas Carlini发布了他用于评估大型语言模型性能的基准。有趣的是,它让GPT-4的表现在大多数其他基准之上。据了解,这个基准是基于多个指标和任务,包括自然语言推理和问答等。

Read More
2024-02-22 talkingdev

OpenAI宣布GPT-4的知识库截止于2023年12月

根据OpenAI平台上的新文档,GPT-4模型的训练数据已更新,包括了截止于2023年12月的信息。GPT-4是一种自然语言处理模型,它可以生成人类能够理解的语言。这一更新表明,GPT-4将有更多的信息可用于训练,以更好地理解...

Read More
2024-02-20 talkingdev

Sora相关参考论文合集整理

HuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...

Read More
2024-02-20 talkingdev

GPTScript:新的自然语言模型编程体验

GPTScript是一种新的脚本语言,可以自动化与OpenAI大型语言模型的交互。该项目的最终目标是创建一个完全基于自然语言的编程体验。GPTScript使用了最新的自然语言处理技术,使得编程变得更加直观和容易上手。GPTScrip...

Read More
2024-02-19 talkingdev

Cohere For AI发布Aya,覆盖100多种语言的LLM

Cohere的非营利研究实验室C4AI发布了一个名为Aya的模型,这是一个新的最先进的开源大规模多语言研究LLM,涵盖101种语言,包括50多种以前未得到服务的语言。

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page