最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...
Read More最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...
Read More本文讨论了将大型语言模型集成到系统和产品中的实用模式。它结合了学术研究、行业资源和从业者的专业知识。本文介绍了七种关键模式,涵盖了提高性能与降低成本/风险以及更接近数据与更接近用户之间的一系列模式。
Read MorePromptTools是一套自托管工具,用于实验、测试和评估大型语言模型、向量数据库和提示。它允许开发者使用代码、笔记本和本地沙盒进行评估。开发者只需几行代码就可以测试不同模型上的提示和参数。PromptTools可以用于...
Read MoreAistro将古老的占星术智慧与现代大型语言模型AI的力量完美结合!Aistro应用让你询问关于你的星座,个性或未来的任何问题。只需输入你的出生日期,时间和地点,就可以获得个性化的阅读体验。这是一次人工智能技术与传...
Read More尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...
Read MoreOllama是一个发布在GitHub上的项目,专为运行、创建和分享大型语言模型而设计。它为开发者和研究者提供了一个集成的平台,可以方便的搭建、训练并分享他们的语言模型。这些模型可以应用于各种语言处理任务,如机器翻...
Read More近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...
Read More