漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-17 talkingdev

深度解析:transformer模型训练背后的数学原理

本文将深入探讨热门的《transformer数学101》文章,以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用,其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而,对于这种...

Read More
2023-08-14 talkingdev

WizardLM团队推出全球最优秀的开源数学模型

近日,WizardLM团队公布了全球最佳的开源数学模型。这个模型在处理多步骤问题的推理能力上表现出色,同时,模型还具有一定的“幻想”能力,这在数学领域表现得十分有趣,并且可以提供解释。如果你对学习数学感兴趣,那...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-07-20 talkingdev

深度解析:GPT-4的思维变革

近期的研究关注了人工智能语言模型GPT-3.5和GPT-4的更新如何改变它们在数学问题解决、回答棘手问题、编写代码和视觉思考等任务中的表现。这些更新不仅优化了算法,还提高了模型的执行效率。在数学问题解决方面,新版...

Read More
2023-07-17 talkingdev

通过长步距优化,证明了收敛速度的显著提升

优化方法的收敛速度是一个数学极限,它决定了在该优化方法指引下,模型找出最佳解决方案的快慢。最新研究发现,周期性学习率可以通过偶尔采取巨大步长得到改进。这项研究极具说服力,它揭示了通过增加优化步骤长度,...

Read More
2023-07-12 talkingdev

Anthropic发布新模型Claude 2:提供更强大的性能和扩展响应

Anthropic公司最近发布了其最新模型Claude 2。Claude 2提供了改进的性能,扩展的响应,并可通过API和beta站点进行访问。Claude 2拥有增强的推理,编码和数学能力,可以处理每个提示中多达100K的令牌,使其能够处理复...

Read More
2023-06-13 talkingdev

Bard更智能:隐式代码执行功能上线

## 新闻摘要: - Bard即将推出两项新功能:将响应导出到Google表格和实现后台代码运行。 - 后台代码运行可以帮助Bard检测问题是否需要数学、逻辑或代码推理,并执行相应的代码,从而提高输出结果的可靠性和准确性。...

Read More
2023-05-29 talkingdev

研究人员开发出新型数据集,测试大型语言模型的问答能力

研究人员基于超过 350 个 STEM(科学、技术、工程和数学)定理,开发了包含 800 个问题-答案对的数据集,用于测试人工智能语言模型。该数据集为衡量人工智能使用这些定理解决复杂的大学级问题的能力提供了新的基准。...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page