大型语言模型的相关内容 - 漫话开发者

2024-04-08 talkingdev

Cohere发布Command R+：面向企业的可扩展大型语言模型

Cohere公司近日推出了Command R+，这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型（LLM）。Command R+具备先进的检索增强生成功能，并支持引用，同时覆盖10种关键语言的多语言处理能力，以及工具使...

2024-04-08 talkingdev

Opera公司旗下的Opera One开发者浏览器近日宣布，现已支持本地运行150种不同的大型语言模型，这些模型来自50个不同的大型语言模型家族。用户无需连接互联网，即可在本地运行这些模型，但需先下载相应的模型文件。此...

2024-04-04 talkingdev

近日，知名浏览器Opera推出了一项创新功能，使用户能够在本地计算机上下载并运行大型语言模型（LLMs）。目前，该功能提供了超过150种不同的模型，涵盖50多个家族，为用户提供了前所未有的便利和灵活性。这些模型可以...

2024-04-03 talkingdev

近日，Draw-and-Understand项目推出了一款名为SPHINX-V的多模态大型语言模型。该模型通过视觉提示，旨在增强人与AI之间的互动交流。SPHINX-V结合了文本、图像与声音等多种信息输入，通过深度学习技术，实现了更加自...

2024-04-02 talkingdev

微软在其广受欢迎的大型语言模型（LLMs）、向量数据库、提示技术以及低代码应用课程的基础上，发布了第二版的课程内容，现已上线GitHub。该课程共包含18课，虽然部分内容具有前瞻性，但依然是踏入该领域的良好起点。...

2024-04-02 talkingdev

尽管RPA（机器人流程自动化）在早期取得了一些成功，但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示，仅有3%的公司能够成功扩大其RPA项目规模。然而，人工智能的最新进展有望改变这一现状。大型语言...

2024-04-02 talkingdev

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段，成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

2024-04-01 talkingdev

EvoEval是一套全新的基准测试工具，专为评估大型语言模型（LLMs）的编码能力而设计。该测试套件采用了比以往更加严格的测试标准，以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...