漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

ConceptMath:一种全新的测试LLMs数学技能的方法

ConceptMath是一种新的双语基准,用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念,从而允许更详细地评估AI在数学上的优势和劣势。 这项技术将有助于开发更准确的AI模型,以应对...

Read More
2024-02-20 talkingdev

OpenMathInstruct-用LLMs提高数学技能

研究人员创建了OpenMathInstruct-1,这是一个用于训练开源大型语言模型数学的新数据集,可与闭源模型的性能相匹配。这一突破包含180万个问题解决对,为更加可访问和有竞争力的数学教学AI工具打开了大门。

Read More
2024-02-15 talkingdev

论文:提高AI数学技能的新方法

研究人员开发了一种新技术,通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容,然后将其注入到现有的语言模型中,以提高其在数学方面的表现。这项技...

Read More
2023-09-21 talkingdev

告诉AI“深呼吸”,数学成绩飙升

Google开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...

Read More
2023-09-06 talkingdev

论文:提升数学技能的研究新突破

这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...

Read More