大语言模型的相关内容 - 漫话开发者

2025-11-13 talkingdev

开源|JSX Tool：浏览器内实时样式编辑的React开发利器

JSX Tool作为一款创新的Chrome扩展工具，成功弥合了浏览器元素检查器与React组件选择器之间的技术鸿沟，为前端开发者提供了革命性的实时样式编辑体验。该工具通过深度集成React生态特性，支持在浏览器运行时直接定位...

2025-11-12 talkingdev

谷歌近日在GitHub开源了Agent Development Kit for Go（ADK-Go），这是一个代码优先的开源工具包，专为构建、评估和部署复杂AI智能体而设计。该工具包将软件开发的核心原则引入AI智能体创建流程，通过声明式API和结...

2025-11-11 talkingdev

近日，前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型，该模型采用混合专家架构，具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面，Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

2025-11-07 talkingdev

中国人工智能初创公司月之暗面（Moonshot）于11月6日正式推出新一代开源生成式AI模型Kimi K2 Thinking。该模型在智能体（Agentic）能力方面表现突出，据称已超越OpenAI的GPT-5水平，成为当前开源领域最具竞争力的AI...

2025-11-05 talkingdev

东南亚科技巨头Grab近日宣布成功研发定制化视觉大语言模型，彻底革新传统OCR文档处理流程。该模型针对东南亚地区非标准化文档格式及多语言混合场景进行专项优化，通过重构开源架构实现推理速度提升50%，同时保持高精...

2025-11-05 talkingdev

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型，但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升，更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本，在创造...

2025-11-03 talkingdev

Anthropic最新研究通过‘概念注入’实验，首次系统验证了大语言模型的内省能力。研究显示，特别是Claude Opus 4和4.1版本模型能够检测并识别被注入的概念，并能通过参照自身‘意图’来识别意外输出。实验证明这些模型具...

2025-10-31 talkingdev

知名AI社区Hugging Face近日发布了一份名为《Smol训练手册》的深度技术指南，首次系统披露了从零开始训练大语言模型的全流程实战经验。该手册覆盖了模型训练生命周期的关键阶段：从小规模消融实验和基础设施调试，到...