漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-08 talkingdev

OnPrem:助力大型语言模型在离线环境下处理敏感数据

近日,GitHub发布了一个名为OnPrem.LLM的新项目。这是一个简单的Python包,可以使大型语言模型更容易地在没有互联网连接的机器上运行,处理非公开或敏感数据。OnPrem.LLM旨在解决在处理敏感数据或在无互联网环境下运...

Read More
2023-09-07 talkingdev

如何构建企业级LLM应用:GitHub Copilot的经验教训)

本文讨论如何构建和扩展使用大型语言模型的应用程序。GitHub花费了三年时间,从想法到生产,开发了GitHub Copilot。该团队制定了一个三阶段计划进行开发:他们确定了LLM应用的有影响力的问题空间,创建了流畅的AI产...

Read More
2023-09-07 talkingdev

苹果每天投入“数百万美元”开发对话式人工智能,旨在大幅改进Siri

据报道,苹果正在投入数百万美元的人工智能产品研究,旨在创建一款能够自动化涉及多个步骤的任务的Siri。大部分预算都用于模型训练,这需要大量昂贵的硬件。该公司已经研究了四年的大型语言模型,但尚不清楚它在多年...

Read More
2023-09-06 talkingdev

论文:提升数学技能的研究新突破

这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...

Read More
2023-09-05 talkingdev

LLM微调Hub:专为使用场景优化的大型语言模型

LLM微调中心是一个包含代码和洞察的平台,专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者,还是研究人员,甚至是业务决策者,都可以在此找到有用的资源。通过微调,大型语言模型的性能可以得到显...

Read More
2023-09-01 talkingdev

Sparse开源揭示反馈如何影响大型语言模型

在训练大型语言模型以理解和匹配人类价值时,我们是使用评分(rating)还是比较(ranking)作为反馈?这项研究发现,选择的方式对结果影响颇大。例如,通过比较评估时,使用排名训练的模型往往更受青睐,但在打分评...

Read More
2023-08-31 talkingdev

微软发布新型AI训练法“思想算法”

微软发布了一种名为“思想算法”(AoT)的新型AI训练方法,旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破,表明了微软在深化机器学习和人工智能技...

Read More
2023-08-25 talkingdev

朝向AGI:我们还缺少什么?

本文探讨了为何现有的大型语言模型(LLMs)不太可能导致人工通用智能(AGI)的发展,以及为何物理学本身将阻止我们从现在的状态突然跃升到AGI。当前的LLMs,虽然在某些方面已经取得了显著的进步,但是在理解和推理的...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page