模型的相关内容 - 漫话开发者

2025-06-20 talkingdev

Refine AI推出企业级应用开发工具Vibe Code，助力快速构建React管理面板与自动化界面

人工智能开发平台Refine AI近日推出企业级内部应用构建工具Vibe Code，该工具允许用户通过自然语言描述需求，结合业务和技术背景，自动生成基于React的管理面板、仪表盘或图形用户界面自动化系统。这一创新将显著降...

2025-06-20 talkingdev

最新研究发现，经过机器遗忘训练的大语言模型（LLMs）会留下可检测的行为和激活空间“指纹”。通过简单的分类器，可以以超过90%的准确率识别出这些遗忘痕迹。这一发现引发了关于隐私和版权的重大关切，尤其是在涉及敏...

2025-06-20 talkingdev

Model Context Protocol (MCP) 规范自2025年3月26日上一版本发布以来，迎来了多项重要更新。此次变更包括移除了对JSON-RPC批处理的支持，新增了对结构化工具输出的支持，并在授权规范中进一步明确了安全注意事项和最...

2025-06-20 talkingdev

一项发表于arXiv的突破性研究提出新型端到端变分编码器架构，通过自动学习韵律特征替代传统手工设计的音高输入，显著提升生成式口语语言模型的自然度表现。该技术摒弃了人工特征工程，直接对语义语音标记与韵律特征...

2025-06-20 talkingdev

最新研究表明，通过StochasTok训练方法可显著提升大语言模型对子词结构的理解能力。该创新技术采用随机分解标记的策略，在训练过程中让模型以多种拆分形式接触词汇（如将'strawberry'随机拆分为'straw|berry'、'str|...

2025-06-20 talkingdev

传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题，主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器，可将LLM推理过程自动编译为单一megakernel（超级内核），通过三大...

2025-06-20 talkingdev

首份关于大语言模型（LLM）服务经济学的综合模型揭示，随着AI公司竞相部署高token消耗的推理模型和智能体，当前扩展推理能力的方法比预期更快遭遇瓶颈。研究发现，网络延迟而非带宽成为主要瓶颈，阻碍了公司通过简单...

2025-06-20 talkingdev

在大型语言模型（LLM）时代，推荐与搜索系统正经历从传统物品ID到丰富'语义ID'（Semantic IDs）的重大转型。这一变革引入了生成式检索和多模态嵌入技术，显著提升了系统处理冷启动覆盖、长尾内容发现的能力，并实现...