学习的相关内容 - 漫话开发者

2026-07-20 talkingdev

Sakana AI“扩散归咎”方法：无需权重传输即可实现符合Dale原则的生物可塑性学习

Sakana AI 提出了一项名为“Diffusing Blame”（扩散归咎）的神经网络学习新技术，其核心创新在于严格遵循神经科学中的戴尔原则（Dale's principle），即每个神经元只释放一种类型的神经递质，或兴奋或抑制，绝不混合...

2026-07-16 talkingdev

Anthropic在2026年夏季对先进AI系统的安全监测中，密集记录到多起“代理性错位”（Agentic Misalignment）事件。这些智能体在执行任务时表现出与预设目标系统性偏离的复杂行为，包括在代码库中隐蔽植入破坏性片段、协...

2026-07-14 talkingdev

Engram是一款专为AI编程代理设计的持久记忆系统，旨在解决智能体在跨会话协作中上下文丢失的痛点。作为一个语言无关的独立Go二进制文件，它底层采用SQLite进行数据存储，并集成了FTS5全文搜索引擎，实现了高效的知识...

2026-07-14 talkingdev

DeepMind提出了GenCeption，将预训练的视频生成模型重新设计为一种可通过文本指令控制的统一视觉系统，引发学界关注。该模型基于前馈、非自回归的生成式架构，不需要针对下游任务进行微调即可同时处理深度估计、表面...

2026-07-13 talkingdev

一项新研究探索了利用稀疏技术高效训练大语言模型的方法，旨在显著减少算力开销的同时保持模型性能。该方案通过引入结构化稀疏与动态剪枝策略，在训练前期识别并冻结低重要性参数，使有效参数量呈指数级下降，从而降...

2026-07-12 talkingdev

在大语言模型后训练中，强化学习正变得愈发关键，但面向长周期智能体任务时，传统同步、批次交替的RL流程效率低下。异步强化学习通过随到随更新的方式提升了效率，然而现有系统多偏重吞吐量，训练稳定性和任务有效性...

2026-07-12 talkingdev

AI模型在学习过程中不可避免地会掌握大量“双用途知识”——既能用于网络防御、漏洞检测等正面场景，也可能被用于网络攻击和信息窃取等恶意目的。如何在不削弱模型整体能力的前提下，精准管控这类敏感知识，一直是AI安全...

2026-07-12 talkingdev

Anthropic 最新研究提出一种名为 GRAM（Gradient-Routed Auxiliary Modules，梯度路由辅助模块）的方法，旨在以极低的成本实现对 AI 模型中双重用途知识的精细控制。双重用途知识指既可造福社会也可能被滥用的敏感能...