语言模型的相关内容 - 漫话开发者

2024-05-21 talkingdev

从零开始构建Llama 3（保姆级教程）

与其说下载语言模型权重并利用各种工具运行它们是一件容易的事，不如说更难的是准确理解代码本身在做什么。这份出色的教程详细展示了如何重建Llama 3并运行训练后的权重的每一个步骤。从安装必要的环境，编写代码，...

2024-05-17 talkingdev

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用，这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法，它优化了视觉和语言之间的协同工...

2024-05-15 talkingdev

Google在今天的发布中公布并展示了一些开源模型。其中一个已经发布的模型是基于SigLIP的视觉语言模型。这个模型非常容易调整和扩展到多种任务。这个Colab笔记本展示了如何用简洁、易读的代码来实现这一点。SigLIP是...

2024-05-15 talkingdev

Genkit是一款针对Firebase的新型工具集，专门用于构建和部署生成性产品。Genkit可以用来启动开源语言模型的服务器。Firebase是Google的移动平台，它可以帮助开发者快速开发高质量的应用，增加用户基础，并获取更多的...

2024-05-14 talkingdev

InternLM-XComposer2是一种在创建和理解复杂的文本-图像内容方面表现优异的视觉语言模型。该模型引入了一种名为Partial LoRA的新型方法，用以平衡视觉和文本的理解，其性能超越了现有的多模态内容创建和理解模型。通...

2024-05-13 talkingdev

Cleanlab最近推出了一款名为Trustworthy Language Model（TLM）的新产品，并为此特别打造了一个在线体验场，也就是TLM Playground。这个在线体验场让用户可以在实际环境中试用这款语言模型，并根据自身的需求进行调...

2024-05-13 talkingdev

E2URec是一种全新的方法，可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据，保证用户隐私的同时，又不牺牲系统性能。这种新方法以用户隐私保护为核心，通过改变推荐系统的学习机制，实现对用户数据的有...

2024-05-13 talkingdev

近日，Salesforce已经训练并发布了广受欢迎的BLIP模型的第三个非商业版本。这款模型主要用于图像理解和标注，是视觉和语言模型的最新成果。Salesforce一直致力于开发和研究这种模型，以提高其在图像理解和标注方面的...