漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-17 talkingdev

Groq低延迟硬件接入Hugging Face推理平台,支持Llama 4和Qwen 32B等模型

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商,这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构,开发者能够以服务器无感知(serverless)方式极速调用Llama...

Read More
2025-06-12 talkingdev

[开源]Weak-to-Strong Decoding:小模型引导大模型实现高效对齐的新方法

近日,GitHub上开源了一项名为Weak-to-Strong Decoding(WSD)的创新技术,该方法通过让小型的对齐模型(aligned model)生成回答的开头部分,再由大型基础模型(base model)继续完成后续内容,从而在保持模型性能...

Read More
2025-05-29 talkingdev

DeepSeek发布升级版R1推理AI模型,现已登陆Hugging Face平台

人工智能研究公司DeepSeek近日宣布对其R1推理模型进行重大升级,并将最新版本发布于Hugging Face平台。这一进展标志着自然语言处理领域的重要突破,R1模型以其卓越的推理能力和高效的参数利用在业界备受关注。此次更...

Read More
2025-05-27 talkingdev

ConvSearch-R1开源:无监督对话搜索查询重构技术

GitHub开源项目ConvSearch-R1提出了一种创新的自监督对话搜索技术,通过强化学习和基于检索的奖励机制,实现了无需外部监督的对话查询重构。该技术利用强化学习框架,将用户对话中的模糊查询自动转化为精准的搜索语...

Read More
2025-05-19 talkingdev

[论文推荐]WavReward:基于音频语言模型的对话系统评估新方法

来自arXiv的最新研究论文提出了一种名为WavReward的创新评估系统,该系统基于音频语言模型,专门用于评估语音对话系统在认知和情感指标上的表现。WavReward通过在ChatReward-30K数据集上进行训练,该数据集包含了大...

Read More
2025-05-15 talkingdev

[论文推荐]大语言模型在多轮对话中容易迷失方向

最新研究发现,大语言模型(LLMs)虽然在单轮对话中表现优异,但在多轮对话场景下性能显著下降。这项发表在arXiv上的研究通过大规模模拟实验揭示了这一现象:在六项生成任务中,LLMs的多轮对话表现平均下降39%。研究...

Read More
2025-04-24 talkingdev

xAI聊天机器人Grok新增视觉识别功能,iOS用户可体验

马斯克旗下人工智能公司xAI推出的Grok聊天机器人近日迎来重要升级,新增了视觉识别能力。这一功能允许iOS用户上传图片或通过摄像头捕捉画面,随后向Grok提问关于所看到内容的问题。该功能与OpenAI的ChatGPT和谷歌的G...

Read More
2025-02-28 talkingdev

CoT-UQ框架:为大型语言模型引入链式思维不确定性量化

近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page