Cloudflare近日发布了一款名为“Workers AI”的无服务器人工智能推断平台,该平台运行在其全球GPU网络上。Workers AI提供了多种流行的开源模型,并与Hugging Face进行了合作。通过无服务器计算的方式,用户可以在Cloud...
Read More拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...
Read More轩辕是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,它不仅可以应对通用领域的...
Read More图像生成是人工智能技术的一个重要应用场景,而如何更好地控制其生成过程,是业界一直在探索的问题。最佳开源模型SDXL,推出了其ControlNet版本,通过利用边缘来调整最终输出,为图像生成提供了新的解决方案。SDXL C...
Read More该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read More近日,GitHub发布了一种名为Functionary的新型语言模型,这种模型具有解读和执行函数/插件的能力,可以准确地判断何时执行一个函数,并能理解其输出结果。Functionary只在需要的时候触发函数,从而大大提高了代码运...
Read MoreSalesforce发布了一组新的语言模型,该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练,参数量为70亿。与目前许多开源模型如MPT或Falcon相比,这些模型具有更好或相当的性能。此外,它...
Read MoreFlamingo是DeepMind的一个模型,可以处理图像和文本。它能够回答视觉问题,并具有强大的语言建模性能。这项工作是对这些模型的复制研究。它还使用了MPT和Red pajama基础模型,这些模型在许可使用上较为灵活。这个复...
Read More