漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-26 talkingdev

Anyscale与NVIDIA合作 推动低延迟生成式AI模型在生产中的应用

Anyscale与NVIDIA最近宣布了一项新的合作伙伴关系,旨在帮助客户将生成式AI模型扩展到生产环境中。通过这次合作,客户可以将Ray与Anyscale的托管运行环境相结合,以提高资源管理、可观测性和自动扩缩容的能力。这项...

Read More
2024-02-29 talkingdev

Databricks、Anyscale和微软的十大AI见解

本文报道了对AI领域前沿公司的创始人的采访,涵盖了他们对AGI到来的看法,如何思考LLMs以及创始人在产品中如何处理AI的简单策略。

Read More
2023-10-16 talkingdev

Anyscale-将Llama 2的冷启动时间缩短至30秒

将模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧,例如内存流,Anyscale将其缩短了20倍,仅需30秒即可到达Llama 2 70B。

Read More
2023-09-20 talkingdev

Anyscale推出Endpoints优化开源人工智能部署并加强与NVIDIA的整合

Anyscale近日发布了Endpoints,这是一种允许开发者使用流行的LLM API将快速、高效、可扩展的LLM集成到他们的应用程序中的工具。同时,该公司还宣布了与NVIDIA的新整合,以提升在Ray上的LLM的性能和开发,Ray是Anysca...

Read More