漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-18 talkingdev

企业真的准备好接受LLM了吗?最新研究报告揭秘

据Composable最新发布的一份报告,81%的技术团队预计在未来两年内将运行2个以上的GenAI模型。然而,为何大多数的项目仍处于试验阶段?这是许多业界人士都在关注的问题。此份报告详尽地分析了当前企业在实施LLM方面的...

Read More
2024-07-18 talkingdev

PraisonAI:简化多Agent系统创建与控制的低代码框架

Praison AI是一个低代码,集中式框架,旨在简化多代理系统的创建和协调,以便于各种LLM应用。该框架利用其他代理框架,具有易于使用,定制和人-代理交互等特点。Praison AI的主要优势在于其将复杂的多代理系统开发流...

Read More
2024-07-18 talkingdev

Prover-Verifier改善LLM可读性

OpenAI训练了一个强大的模型,以便为弱模型输出更易读的文本,并发现这导致了LLM整体可读性的普遍提高。通过对弱模型进行精准评估,强模型的文本输出效果得到大幅提升。在日常实际应用中,这种提升将促进文本信息的...

Read More
2024-07-17 talkingdev

SmolLLM-HF推出高性能小语言模型

Hugging Face近日推出了一套名为SmolLLM的小型语言模型套件,其性能超越许多大型模型。这主要得益于数据集的精心策划和管理。SmolLLM以其精细的设计和优化,展示出了小型语言模型的巨大潜力和价值。这种模型不仅在处...

Read More
2024-07-17 talkingdev

DeRTa-提升LLMs安全性,解耦拒绝训练方法

近日,一种名为解耦拒绝训练(DeRTa)的新方法被提出,这种新方法通过解决拒绝位置偏差问题,进一步提高了大型语言模型(LLMs)的安全性调优效果。LLMs在各类应用场景中起着重要作用,安全性问题也因此变得尤为重要...

Read More
2024-07-16 talkingdev

SpreadsheetLLM-将电子表格转换为LLM可识别数据

近日,一篇引人注目的论文详细介绍了如何将电子表格转化为现代LLM可以使用的表示方式。这种转换方法可以广泛应用于问答、格式化以及其他数据操作中。这篇论文为我们提供了一个全新的视角去思考如何更好地利用电子表...

Read More
2024-07-12 talkingdev

LookbackLens-解决LLM幻觉问题的最简方案

Lookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

Read More
2024-07-11 talkingdev

RouteLLM:为LLM路由器提供服务和评估的开源框架

RouteLLM是一个为LLM路由器提供服务和评估的框架,该框架已在GitHub Repo上发布。在现代技术世界中,路由器在网络连接和数据传输中扮演着至关重要的角色。然而,随着技术的快速发展,对路由器的需求和期望也在不断增...

Read More
2024-07-10 talkingdev

illm-tsc: 利用AI增强交通信号控制框架开源

研究人员已经开发出一个新的框架,该框架将大型语言模型与强化学习相结合,以提高交通信号控制系统的性能。这种新的方法借助AI的能力,使交通信号控制系统能够更有效地管理交通流量,提高道路效率,降低交通拥挤,从...

Read More
2024-07-10 talkingdev

MobileLLM:专为移动设备优化的超千万参数语言模型

MobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page