本文深入探讨了基于变换器的语言模型推理的“光速”理论极限,强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力,而非执行计算的速度,这对于优化和理解AI性能是一...
Read More近日,Skyvern项目在GitHub上发布,该项目利用LLMs和计算机视觉技术自动化浏览器流程。Skyvern提供了一个简单的API端点,可以完全自动化手动工作流程,替代脆弱或不可靠的自动化解决方案。其实现原理是利用LLMs提供...
Read More最近的一项研究中,研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差,提供更复杂的回复,使不当回复更难以检测。
Read More这项工作表明,您可以单独训练模型,然后将它们合并成单个Mixture-of-Experts模型。
Read MoreGoogle最近开展了LLM bugSWAT活动,邀请黑客们在其人工智能系统中寻找安全漏洞。参赛选手Joseph “REZ0” Thacker、Justin “RHYNORATER” Gardner和Roni “LUPIN” Carta在Google的AI功能中发现了漏洞,包括利用GraphQL端...
Read MoreCovariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...
Read MoreOpenAI宣布将三位新成员加入其董事会,分别是Sue Desmond-Hellmann博士、Nicole Seligman和Fidji Simo,同时CEO Sam Altman也将回归董事会。这一新闻表明OpenAI正以其卓越的技术和高度的声誉继续壮大其团队,同时扩...
Read MoreOpenAI宣布了新的董事会名单,同时结束了调查Sam Altman被撤职的事件。Sam Altman将与Dr. Sue Desmond-Hellmann、索尼前执行副总裁兼全球总法律顾问、索尼娱乐总裁Nicole Seligman、Instacart CEO和董事长Fidji Simo...
Read More近期,开源社区发布了一个名为Fructose的Python包,其主要用途是为LLM调用创建可靠强类型接口。 Fructose是一个轻量级Python包,它可以帮助开发人员避免与LLM交互时的一些常见错误,例如类型不匹配或缺失参数。通过...
Read MoreCo-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。
Read More