漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-21 talkingdev

告诉AI“深呼吸”,数学成绩飙升

Google开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...

Read More
2023-09-21 talkingdev

论文:让大型语言模型在医学上发挥更大作用

这项研究的重点是使已经擅长理解和生成文本的大型语言模型,在回答医学问题方面表现得更好。大型语言模型(LLMs)已经在很多领域包括医学领域显示出了巨大的潜力,然而,尽管如此,它们在理解和回答具体的医学问题方...

Read More
2023-09-21 talkingdev

论文:利用大型语言模型提升推荐效果

本研究探讨了大型语言模型(LLMs)如何更好地进行序列推荐。LLMs正在许多技术领域引发革命,它们能够在如推荐下一首歌曲或下一部电影等场景中发挥重要作用。通过这种方式,我们可以创建更加智能、更加个性化的推荐系...

Read More
2023-09-15 talkingdev

Patronus AI获得300万美元种子轮融资,提升企业对LLMs的信心

Patronus AI近日宣布获得由Lightspeed领投的300万美元种子轮融资,该团队计划构建真实世界评分体系,以帮助企业理解LLMs(大型语言模型)的实用性。在当前,大型语言模型在企业中的应用越来越广泛,然而,将其真正落...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-12 talkingdev

大型语言模型能否具备推理能力?

大型语言模型(LLMs)是否具备人类般的推理能力的争论仍在进行中。一方面,有些研究显示,这些模型主要依赖于记忆和模式匹配。另一方面,也有研究显示,它们在与训练数据相关的任务中表现出色,显示出一定的推理能力...

Read More
2023-09-08 talkingdev

论文:运用大型语言模型预测股票趋势

这篇论文介绍了一种使用大型语言模型(LLMs)快速分析公司的年度报告的方法,使得理解公司的财务健康状况,甚至预测股票价格变得更加简单。LLMs可以处理大量文本信息,提炼出关键数据,使投资者能够在短时间内获取到公...

Read More
2023-09-06 talkingdev

论文:提升数学技能的研究新突破

这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page