针对多模态大语言模型(MLLM)中的幻觉问题,研究人员开发了MHaluBench,一个新的评估幻觉检测方法的基准。该工具可以帮助研究人员更好地评估语言模型的幻觉能力,从而有效提高模型的质量和准确性。目前,该工具已经...
Read MoreChatLLM for VS Code是AI辅助自动完成的开源替代品。它现在支持任何Ollama模型,以及使用封闭的API模型。在这个自动化和机器学习越来越流行的时代,ChatLLM提供了一种开源替代方案,为人们提供了更多的选择。
Read More研究表明,经过调整的BERT模型在检测假新闻方面比通用的LLM模型(如GPT-3.5-turbo)更有效。BERT模型是一种预训练的自然语言处理模型,可用于各种文本任务。由于假新闻的传播日益严重,利用AI技术检测假新闻变得越来...
Read MoreHugging Face推出了可定制的Hugging Chat助手。这允许使用开源LLM的选择自由创建AI聊天机器人,与OpenAI的订阅模式形成对比。
Read More1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性。
Read More近日,GitHub上一个名为Plock的Repo备受关注。该Repo提供了一种新的方法,可以让用户在任何可以输入文本的地方直接使用LLM。LLM是一种专业术语,代表着一种很强的自然语言处理技术。用户只需在输入框中输入相应的命...
Read MoreEnchanted 是一个开源的 iOS 应用,它允许你在移动设备上运行语言模型。该应用能够快速地识别语音和文本并进行分类,是一个非常有用的工具。这个项目的代码已经在 GitHub 上公开,并且允许开发者自由调整和使用。
Read More本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...
Read MoreLLMs from Scratch是学习如何从零开始构建语言模型的一组不完整但有前途的任务。该仓库提供了构建自然语言处理模型所需的基本知识,包括基础数学和机器学习理论,以及一些常见的语言模型架构和实现代码。通过完成这...
Read More近日,研发团队宣布推出了AgentBoard,一款专为多轮LLM代理设计的基准测试工具。AgentBoard不仅可以评估LLM代理的最终成功率,还提供了分析评估板以进行更详细的模型评估。这款工具可以更全面地评估LLM代理,为LLM代...
Read More