扩展的相关内容 - 漫话开发者

2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention（DCA）扩展了大型语言模型（如Llama2 70B）的能力，使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块，增强了模型对短期和长期上下文的理解。

2024-03-01 talkingdev

联邦网络可能会像电子邮件一样分散，但不会太多。个人实例可能会很少。本文解释了联邦网络为什么不会分布式，并探讨了分布式社交系统的思路。可能可以使用RSS的简单扩展来比联邦网络更去中心化，RSS已经可以包含很多...

2024-02-28 talkingdev

由数据质量研究专家创立的 DatalogyAI 公司最近获得了1100万美元的融资。该公司旨在让数据集的可扩展筛选变得更加简单。

2024-02-28 talkingdev

据悉，Litestar是一款轻量级、灵活的ASGI框架，适用于构建高性能API。其优点在于提供了简洁的API并支持异步编程模型，还具有可扩展性、易用性和可读性等优秀特性。此外，Litestar还为开发人员提供了丰富的文档和示例...

2024-02-26 talkingdev

去年，Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

2024-02-22 talkingdev

Sasha Rush发布了一份注释教程，介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误，它目前无法扩展，但它是技术的极端演示，并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...

2024-02-22 talkingdev

Scribe近日完成了由红点风投领投的B轮融资，以加速其基于人工智能的平台的发展。该平台自动化创建视觉化的分步指南，促进组织内知识共享。超过100万个团队使用Scribe，其中包括97%的财富100强企业。该公司正在扩展其...

2024-02-21 talkingdev

近日，OpenLLMetry-JS 在 GitHub 上发布，它是基于 OpenTelemetry 构建的一组扩展，可以完全观测您的 LLM 应用程序。OpenLLMetry-JS 为您提供了完整的可观测性，不仅可以实时监测您的应用程序，还可以帮助您诊断和优...