漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
2023-08-04 talkingdev

论文:提升大型语言模型的错误识别能力

最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...

Read More
2023-08-03 talkingdev

大型语言模型系统与产品的设计模式

本文讨论了将大型语言模型集成到系统和产品中的实用模式。它结合了学术研究、行业资源和从业者的专业知识。本文介绍了七种关键模式,涵盖了提高性能与降低成本/风险以及更接近数据与更接近用户之间的一系列模式。

Read More
2023-08-02 talkingdev

PromptTools:自托管工具用于评估LLM和向量数据库

PromptTools是一套自托管工具,用于实验、测试和评估大型语言模型、向量数据库和提示。它允许开发者使用代码、笔记本和本地沙盒进行评估。开发者只需几行代码就可以测试不同模型上的提示和参数。PromptTools可以用于...

Read More
2023-08-01 talkingdev

占星术与AI的完美结合 - Aistro产品发布

Aistro将古老的占星术智慧与现代大型语言模型AI的力量完美结合!Aistro应用让你询问关于你的星座,个性或未来的任何问题。只需输入你的出生日期,时间和地点,就可以获得个性化的阅读体验。这是一次人工智能技术与传...

Read More
2023-08-01 talkingdev

论文:利用大型语言模型提升交通安全性

尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...

Read More
2023-08-01 talkingdev

Ollama开源:运行、创建和分享大型语言模型

Ollama是一个发布在GitHub上的项目,专为运行、创建和分享大型语言模型而设计。它为开发者和研究者提供了一个集成的平台,可以方便的搭建、训练并分享他们的语言模型。这些模型可以应用于各种语言处理任务,如机器翻...

Read More
2023-07-27 talkingdev

AI文本错误检测新工具:FacTool(GitHub Repo)

近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...

Read More
  1. Prev Page
  2. 31
  3. 32
  4. 33
  5. Next Page