大语言模型的相关内容 - 漫话开发者

2025-12-06 talkingdev

OpenRouter年度重磅报告：推理模型已占AI使用量半壁江山，开源模型采用率持续攀升

根据AI模型聚合平台OpenRouter发布的最新年度研究报告，通过对过去一年内超过100万亿个令牌（tokens）的实证分析，揭示了当前AI模型使用格局的重大转变。报告指出，以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

2025-12-05 talkingdev

Hugging Face平台近日推出了一项名为“Hugging Face Skills”的新功能，该功能赋予了Anthropic公司的Claude AI模型直接微调开源大语言模型的能力。这项技术突破意味着，用户现在可以通过Claude的对话界面，直接提交模...

2025-12-05 talkingdev

OpenRouter平台近期发布了一份名为《AI现状》的实证研究报告，该研究标志着大语言模型（LLM）在实际应用中的一个关键转折点。报告指出，过去一年，该领域已从传统的单次模式生成，迅速转向多步骤的深思熟虑式推理。...

2025-12-05 talkingdev

检索增强生成（RAG）在理论上看似简单：检索相关文档，将其输入大语言模型，获得有据可依的答案。然而，在实践中，系统的成败取决于数十个关键决策。Algolia发布的白皮书全面剖析了构建高效RAG系统的完整技术管线。...

2025-12-05 talkingdev

近日，AI模型聚合平台OpenRouter发布了一份名为《State of AI》的深度实证研究报告。该研究基于对超过100万亿（100T）真实世界大语言模型交互令牌的分析，覆盖了不同任务类型、地理区域和时间跨度，为当前AI技术的实...

2025-12-04 talkingdev

据《麻省理工科技评论》报道，OpenAI正在测试一种新颖的方法，旨在让大语言模型（LLMs）能够主动“坦白”或“自我报告”其内部运作过程。这项研究探索如何训练模型不仅输出最终答案，还能生成“自白书”，详细描述其完成任...

2025-12-01 talkingdev

在大型语言模型推理优化领域，Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理，特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...

2025-11-30 talkingdev

开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型（代号Nano Banana）推出开源CLI工具Nano PDF，实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像，结合用户文本提示调用多模态AI...