漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-22 talkingdev

VLM开源:增强AI对抗攻击的防御能力

近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...

Read More
2024-02-21 talkingdev

OpenLLMetry:完美支持 LLM 应用的开源监测工具

近日,OpenLLMetry-JS 在 GitHub 上发布,它是基于 OpenTelemetry 构建的一组扩展,可以完全观测您的 LLM 应用程序。OpenLLMetry-JS 为您提供了完整的可观测性,不仅可以实时监测您的应用程序,还可以帮助您诊断和优...

Read More
2024-02-21 talkingdev

可租用的GPU集群列表

本文提供了一份可租用的GPU集群列表,这些集群可按小时租用,提供高性能计算能力,适用于需要大量计算的机器学习和深度学习任务。以下是可租用的GPU集群列表: 1. AWS EC2 P3(美国) 2. Google Cloud Platform(欧...

Read More
2024-02-21 talkingdev

OpenRLHF开源,提供基于Ray的RLHF实现

近日,GitHub上有一个新的仓库OpenRLHF发布了。这是一个基于Ray的RLHF实现,专为Llama样式模型设计。该仓库集成了多种PPO稳定技巧,以提高性能。Ray是一款新型的分布式计算框架,它具有高效、易用等特点,支持快速构...

Read More
2024-02-21 talkingdev

控制向量库开源,轻松地实现语义生成

控制向量(ControlVectors)是一种廉价的语义生成输出控制方法。它们的训练比LoRA更便宜,但仍然可以非常有效。这个控制向量库使得使用这种技术更加简单。控制向量库是由一群开发人员推出的,作为一项开源项目,它的代...

Read More
2024-02-21 talkingdev

Google Workspace推出Gemini Business和Gemini Enterprise计划

Google正在为Workspace客户推出“Gemini Business”和“Gemini Enterprise”计划,提供对其先进的AI模型Gemini 1.0 Ultra的访问,并提供企业级数据保护。它不会使用员工的对话进行模型训练。

Read More
2024-02-21 talkingdev

SSD技术已变得非常快, 但在云端表现仍有瓶颈

尽管过去七年来SSD技术有了很大的提升,但AWS NVMe实例的性能仍然停留在每个SSD 2GB/s的速度。这远远低于SSD的最大速度。这是因为在云端中,SSD不能直接连接到CPU和内存。相反,SSD必须通过网络连接到服务器,这会导...

Read More
2024-02-19 talkingdev

RoCo-开源高效LLM新策略

GitHub近日开源了一项名为RoCo的新策略,该策略旨在提高LLM在有限资源环境下的效率。RoCo是一种强大的缓存遗漏策略,可以帮助用户更好地使用LLM。该政策的发布将有助于优化机器学习应用的性能,提高效率。RoCo的开源...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page