漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention(DCA)扩展了大型语言模型(如Llama2 70B)的能力,使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块,增强了模型对短期和长期上下文的理解。

Read More
2024-03-01 talkingdev

比联邦网络还要去中心化吗?——RSS扩展的分布式社交系统探究

联邦网络可能会像电子邮件一样分散,但不会太多。个人实例可能会很少。本文解释了联邦网络为什么不会分布式,并探讨了分布式社交系统的思路。可能可以使用RSS的简单扩展来比联邦网络更去中心化,RSS已经可以包含很多...

Read More
2024-02-28 talkingdev

数据质量研究专家创立 DatalogyAI 公司,获1100万美元融资

由数据质量研究专家创立的 DatalogyAI 公司最近获得了1100万美元的融资。该公司旨在让数据集的可扩展筛选变得更加简单。

Read More
2024-02-28 talkingdev

Litestar:打造高性能API的轻量级ASGI框架

据悉,Litestar是一款轻量级、灵活的ASGI框架,适用于构建高性能API。其优点在于提供了简洁的API并支持异步编程模型,还具有可扩展性、易用性和可读性等优秀特性。此外,Litestar还为开发人员提供了丰富的文档和示例...

Read More
2024-02-26 talkingdev

Mozilla担任NeurIPS效率挑战的评估者

去年,Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

Read More
2024-02-22 talkingdev

深入探究:硬核Mamba技术加速

Sasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...

Read More
2024-02-22 talkingdev

Scribe获得2500万美元B轮融资

Scribe近日完成了由红点风投领投的B轮融资,以加速其基于人工智能的平台的发展。该平台自动化创建视觉化的分步指南,促进组织内知识共享。超过100万个团队使用Scribe,其中包括97%的财富100强企业。该公司正在扩展其...

Read More
2024-02-21 talkingdev

OpenLLMetry:完美支持 LLM 应用的开源监测工具

近日,OpenLLMetry-JS 在 GitHub 上发布,它是基于 OpenTelemetry 构建的一组扩展,可以完全观测您的 LLM 应用程序。OpenLLMetry-JS 为您提供了完整的可观测性,不仅可以实时监测您的应用程序,还可以帮助您诊断和优...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page