漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-11 talkingdev

AI语言模型通过强化学习掌握数独解题能力

最新研究展示了如何通过强化学习技术,使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法,并在Qwen 2.5等模型上进行了实验,无需依赖外部数据或更大模型的蒸馏。研...

Read More
2024-10-05 talkingdev

Arthur Whitney的单行代码数独解法引发关注

2011年,计算机科学家Arthur Whitney以其独特的编程风格开发了一款单行代码数独解法。该解法凭借其简洁性和高效性,引起了技术界的广泛关注。通过应用递归算法以及巧妙的逻辑推理,Whitney成功地将复杂的数独解题过...

Read More