Andrej Karpathy最近在GitHub上发布了一个新的仓库,概述了他正在进行的一个新课程。这个课程涉及到构建一个能够讲述故事的对齐语言模型。课程包括视频讲座、代码以及其他学习材料。Karpathy的这个项目是一次尝试,...
Read Morellama.ttf是一个创新的字体文件,它不仅包含文字样式信息,还内嵌了一个大型语言模型(LLM)以及相应的推理引擎。这一技术突破利用了Harfbuzz字体塑形引擎中的Wasm塑形器,这个塑形器允许使用任意代码来塑形文本。通...
Read MoreMantle公司采用了Gemini 1.0 Pro LLM,并设置了一个百万token窗口,将原型项目转换为生产就绪的代码库,通过处理样板代码和重复模式,从而减少了工作量。这种方法利用了大量上下文和迭代代码生成,为开发团队节省了...
Read MoreTxtai作为一个全能的嵌入式数据库,为语义搜索、LLM编排以及语言模型工作流提供了集成解决方案。它便于开发者进行语言模型的开发与部署,从而提高了开发效率。这个GitHub项目让我们能够更好地理解和利用大数据和人工...
Read More研究人员提出了一种名为“多模态专家混合体” (MoME) 的方法,以解决通用的多模态大型语言模型(MLLMs)中的任务干扰问题。在多模态大型语言模型中,任务干扰是一个常见的问题,它可能会影响模型的性能和效率。MoME的提...
Read MoreGitHub近日发布了一款命令行实用工具——LLM2sh。这项工具的主要功能在于利用LLMs技术,将用户的普通语言请求转化为shell命令。通过LLM2sh,用户可以用日常语言来控制和指导计算机操作,提升了命令行的便利性和亲和力...
Read MoreE5-V是一种新的框架,其改编了多模态大型语言模型(MLLMs)以创建全球多模态嵌入。通过使用提示,它弥补了不同输入类型之间的差距,而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...
Read More研究人员提出了针对大型语言模型(LLMs)的补丁级别训练,以提高训练效率。补丁级别训练是一种新的技术,目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别,提高了模型的训练效率,...
Read More据Composable最新发布的一份报告,81%的技术团队预计在未来两年内将运行2个以上的GenAI模型。然而,为何大多数的项目仍处于试验阶段?这是许多业界人士都在关注的问题。此份报告详尽地分析了当前企业在实施LLM方面的...
Read MorePraison AI是一个低代码,集中式框架,旨在简化多代理系统的创建和协调,以便于各种LLM应用。该框架利用其他代理框架,具有易于使用,定制和人-代理交互等特点。Praison AI的主要优势在于其将复杂的多代理系统开发流...
Read More