Scale的LLM引擎包允许用户微调开源大型语言模型,以提高在特定领域用例上的性能。用户可以微调的模型之一是Llama 2,这是与Meta合作的结果。这种开源大型语言模型的优化,使其在特定领域用例上的性能得到提升,为行...
Read More由Nous研究所训练的13B参数的LongLlama-2-13B模型现在可以处理多达8k的令牌(context)。该成果是通过精细调整和线性位置插值缩放实现的。LongLlama-2-13B模型的进步标志着人工智能技术的一大步,使得处理大规模数据变...
Read More高通作为移动处理器制造商,正准备将其旗舰人工智能Llama 2模型引入到智能手机中。这一举措旨在优化手机的语言处理能力,使其在没有网络连接的情况下仍能执行复杂的语言任务。高通和Meta的这次合作,预计将为移动端...
Read MoreAndrej Karpathy 编写了一个受到llama.cpp极大启发的酷炫库,可以用于纯C语言训练和推理新的Llama 2模型。这个库对于那些对底层编程感兴趣的人来说是一个很好的资源(就像他的所有代码一样)。GPT4在编写过程中给予...
Read More传统的矢量存储方法在金融查询领域中存在一定的局限性,而现在我们可以通过结合元数据和现有的查询语言来显著提高查询结果的质量。openBB和LlamaIndex两个技术在这方面发挥了关键作用。openBB作为一个开放性的基准数...
Read MoreRAGstack(GitHub Repo)为企业提供了一种部署私有ChatGPT替代方案的解决方案。该方案支持在企业的私有网络环境(VPC)内部署开源大型语言模型,如Llama 2、Falcon和GPT4All。企业可将其连接到自己的知识库,将其作...
Read More近日,GitHub上出现了一个名为Ollama的新项目,它专为在macOS系统上运行和打包大型语言模型而设计。Ollama项目为那些在macOS上使用大型语言模型的开发者提供了一种简便的解决方案,帮助他们更轻松地将这些模型集成到...
Read More微软与Meta宣布在Azure和Windows上支持Llama 2,一个大型语言模型家族。这是Llama 2首次商业化发布。该合作使得开发者可以在Azure上构建、微调和部署基于Llama 2的模型,同时还可以针对Windows本地使用进行优化。此...
Read More