苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...
Read MoreScholarTurbo是一款创新产品,它利用ChatGPT技术实现了与PDF文件的互动。现在,用户可以通过ScholarTurbo工具,直接与PDF文件进行交流和问答。这项技术的应用将大大提高学术研究和文献阅读的效率。传统阅读PDF文件的...
Read More这篇文章由a16z撰写,讨论了一些新兴的LLM应用架构,包括联邦学习、边缘计算和无服务器计算。这些架构为LLM提供了新的扩展方式和更高效的运行方式,可能会在未来推动LLM的广泛应用。
Read MoreBlush是一款AI约会模拟器,帮助用户练习情感和亲密关系技巧。这款应用是由AI聊天机器人Replika的开发公司Luka开发的,它向用户介绍了1000多个AI“crushes”,用户可以与其互动以“练习”情感亲密度。该应用的开发团队与...
Read More从头开始训练基础模型是一项具有挑战性的任务。斯坦福大学的语言模型团队发布了一个在Jax上的框架,使这个过程更加简化。它提供了多种数据和模型并行策略,简化了编程过程。
Read MoreOpenAI的GPT-4语言模型现在可以使用外部工具来完成任务,例如查看天气、获取股票价格或在公司数据库中查找数据。这是相对于之前的GPT版本的一项重大改进,之前的版本由于其受训数据的限制,功能受到了限制。
Read More本文讨论了几种加速大型语言模型(LLM)训练和推理的技术,以使用高达100K个输入令牌的大上下文窗口。这些技术包括:ALiBi位置嵌入,稀疏注意力,闪电注意力,多查询注意力,条件计算以及使用80GB的A100 GPU。
Read MoreNvidia A100是市场上最强大的GPU之一。它们已被用于训练迄今为止最流行的模型之一。它们是数据中心的GPU,通常意味着您无法在自己的硬件上运行它们。本文探讨了如何以几千美元的价格自己组装一个本地运行的A100超级...
Read More