漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-13 talkingdev

DALL-E 3加入海象:提示工程的探究

DALL-E 3是一项有趣的实验,它展示了不同的提示如何生成不同的图像,以及后续的提示如何进一步完善这些图像。这项实验为人工智能领域的自然语言处理提供了新的思路和方法。

Read More
2023-12-13 talkingdev

KwaiAgents发布AI代理系统,使用LLM模仿人类认知技能

KwaiAgents是一个先进的代理系统,使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台,使得更多的研究人员可以参与到该项目中来。该...

Read More
2023-12-08 talkingdev

优化LLMs使其可实现真实世界应用

Lightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。 这些技术可以优化自然语言处理模型,从而帮助它们更好地适应真实世界的应用。 在这篇文章中,您将了解到这些优化技术的工作原理以及它们如...

Read More
2023-12-05 talkingdev

万能GPT来袭,美国政府与英特尔启动ScienceGPT训练计划

近日,美国政府与英特尔公司合作启动了一个名为ScienceGPT的训练计划。该计划旨在训练一个万亿参数的GPT模型,以便提高自然语言处理的效率和精度。GPT(Generative Pre-trained Transformer)是一种基于Transformer...

Read More
2023-12-05 talkingdev

论文:无注意力的扩散模型

现代大多数扩散模型都使用了注意力机制,但并非所有模型都如此。最近,对状态空间的兴趣浪潮已经传到了扩散模型中,这为理论加速和有趣的应用开辟了道路。扩散模型是一种机器学习模型,用于对自然界中的信号进行建模...

Read More
2023-12-05 talkingdev

OpenAI的GPT商店延迟至明年发布

由于一些意外情况导致公司忙碌,OpenAI的GPT商店将推迟到明年发布。GPT商店是一个在线平台,允许用户购买和使用OpenAI的自然语言处理模型。该平台旨在帮助研究人员、开发人员和企业更轻松地访问这些模型,从而加速AI...

Read More
2023-12-05 talkingdev

LLM可视化(网站)

LLM可视化是一个展示nano-gpt模型的网站,该模型有85000个参数。它展示了该模型如何将一个包含6个字母的序列按字母顺序排列。此网站可以帮助人们更好地了解和理解自然语言处理中的模型和算法。

Read More
2023-11-30 talkingdev

使用LLM的成本是多少?

对不同模型的LLM常见问题的详细回顾表明,目前它真的是成本限制的。随着最新的OpenAI公告和开源模型的进展,这种情况可能会发生变化。虽然LLM在预测和生成自然语言方面表现出色,但目前的成本可能会限制其广泛应用。...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page