漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

深度了解Tinygrad:AI编译器的全新引领者

Tinygrad是一款用于训练深度学习模型的工具包。这套笔记是AI编译器的极佳入门读物,更是为深入了解Tinygrad内部机制做好准备。Tinygrad以其精简的设计和高效的性能,为AI领域带来了新的可能性。无论你是AI领域的专家...

Read More
2024-06-26 talkingdev

AI与Morph Labs联手优化信息检索增强型生成模型

近日,AI与Morph Labs联合发布了一篇关于信息检索增强型生成(RAG)模型微调的优秀博客文章。在文章中,他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型,它结合了信息检索技术...

Read More
2024-06-20 talkingdev

Logit Prisms:分解Transformer输出以提高解释性

Logit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...

Read More
2024-05-28 talkingdev

深度学习框架Tinygrad 0.9.0正式发布

深度学习框架Tinygrad 0.9.0正式发布。Tinygrad是一个轻量级的深度学习框架,支持Python和JavaScript。Tinygrad 0.9.0增加了对自定义函数的支持,以及其他一些性能和稳定性的改进。它的设计使其非常适合在边缘设备上...

Read More
2024-05-27 talkingdev

Modula-模块化范数方法提升神经网络训练效率

模块化范数是一种全新的神经网络权重更新归一化方法,能够高效扩展不同规模网络的训练。这种方法通过调整网络的权重更新过程,确保在各种网络规模下都能保持高效的训练速度和准确性。与传统的归一化方法相比,模块化...

Read More
2024-05-14 talkingdev

Model Explorer:模型图形的直观分层可视化

深度学习模型的复杂性使得理解它们变得困难。为了解决这个问题,研究人员提出了一个名为“Model Explorer”的工具,它提供了直观、分层的可视化模型图形。这个工具可以帮助用户更好地理解深度学习模型,而无需阅读大量...

Read More
2024-05-14 talkingdev

TEFN深度学习模型,提升长时间序列预测

时序证据融合网络(TEFN)是GitHub最近发布的一种全新深度学习模型,旨在提升长期时间序列预测的准确性和稳定性。这一模型结合了信息融合和证据理论,通过专门的模块来提高预测的准确性和稳定性。其主要特点是能够综...

Read More
2024-05-14 talkingdev

苹果正在敲定与OpenAI的协议,将ChatGPT特性引入iPhone

苹果公司正在与OpenAI接近达成一项协议,计划将ChatGPT技术整合到iPhone中,可能会在即将推出的iOS 18版本中作为其AI增强功能的一部分。ChatGPT是一款深度学习模型,可以生成人类的语言,此举将极大地提升iPhone的AI...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page