漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-22 talkingdev

Apple发布新版visionOS SDK,开发者工具现已可用

苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...

Read More
2023-06-22 talkingdev

ScholarTurbo:使用ChatGPT与PDF文件进行交互的学术产品

ScholarTurbo是一款创新产品,它利用ChatGPT技术实现了与PDF文件的互动。现在,用户可以通过ScholarTurbo工具,直接与PDF文件进行交流和问答。这项技术的应用将大大提高学术研究和文献阅读的效率。传统阅读PDF文件的...

Read More
2023-06-21 talkingdev

新兴架构为LLM应用提供新机遇

这篇文章由a16z撰写,讨论了一些新兴的LLM应用架构,包括联邦学习、边缘计算和无服务器计算。这些架构为LLM提供了新的扩展方式和更高效的运行方式,可能会在未来推动LLM的广泛应用。

Read More
2023-06-20 talkingdev

AI约会模拟器Blush:超越性伴侣的存在

Blush是一款AI约会模拟器,帮助用户练习情感和亲密关系技巧。这款应用是由AI聊天机器人Replika的开发公司Luka开发的,它向用户介绍了1000多个AI“crushes”,用户可以与其互动以“练习”情感亲密度。该应用的开发团队与...

Read More
2023-06-19 talkingdev

斯坦福的基础模型框架

从头开始训练基础模型是一项具有挑战性的任务。斯坦福大学的语言模型团队发布了一个在Jax上的框架,使这个过程更加简化。它提供了多种数据和模型并行策略,简化了编程过程。

Read More
2023-06-19 talkingdev

GPT-4具备使用工具的能力,这是一大突破

OpenAI的GPT-4语言模型现在可以使用外部工具来完成任务,例如查看天气、获取股票价格或在公司数据库中查找数据。这是相对于之前的GPT版本的一项重大改进,之前的版本由于其受训数据的限制,功能受到了限制。

Read More
2023-06-19 talkingdev

百万上下文窗口背后的秘密武器

本文讨论了几种加速大型语言模型(LLM)训练和推理的技术,以使用高达100K个输入令牌的大上下文窗口。这些技术包括:ALiBi位置嵌入,稀疏注意力,闪电注意力,多查询注意力,条件计算以及使用80GB的A100 GPU。

Read More
2023-06-19 talkingdev

以低廉的价格运行A100

Nvidia A100是市场上最强大的GPU之一。它们已被用于训练迄今为止最流行的模型之一。它们是数据中心的GPU,通常意味着您无法在自己的硬件上运行它们。本文探讨了如何以几千美元的价格自己组装一个本地运行的A100超级...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page