可解释性的相关内容 - 漫话开发者

2025-06-27 talkingdev

[开源] SymbolicAI：从神经符号视角探索大语言模型的组合式可微分编程库

ExtensityAI团队在GitHub开源了SymbolicAI项目，这是一个基于神经符号系统（Neuro-Symbolic）架构设计的组合式可微分编程库，旨在为大语言模型（LLMs）提供结构化推理能力。该项目通过将符号逻辑与神经网络梯度优化...

2025-06-26 talkingdev

近日，GitHub上出现了一个名为System_prompts_leaks的仓库，其中收集了多个AI聊天机器人和模型的泄露系统提示（system prompts），揭示了这些AI的内部指令和行为准则。这一发现引发了广泛关注，因为系统提示是AI模型...

2025-06-18 talkingdev

Kapa.ai最新发布的文档《Writing documentation for AI: best practices》详细探讨了为AI系统撰写高效文档的核心原则，尤其针对检索增强生成（RAG）技术栈的优化需求。文章指出，RAG系统的性能高度依赖知识库文档的...

2025-06-11 talkingdev

JavelinGuard是一套专为检测大语言模型(LLM)交互中恶意意图而设计的低成本高性能模型架构。该研究提出了多种具有不同速度、可解释性和资源需求权衡的架构方案，并特别针对生产环境部署进行了优化。论文详细探讨了这...

2025-06-03 talkingdev

一项突破性研究通过对比模型在随机数据（无法泛化）和真实文本上的训练表现，开发出区分记忆与泛化的新方法。研究发现，模型会先记忆训练数据直至容量饱和，随后转向学习通用模式。以GPT类Transformer为例，每个参数...

2025-05-26 talkingdev

谷歌旗下实验室推出的Flow TV平台，通过持续流媒体形式展示由用户生成的AI视频片段及其对应提示词，并按主题频道进行分类。该平台基于谷歌最新Veo AI视频生成技术，标志着生成式AI在影视内容创作领域的重大突破。Veo...

2025-05-16 talkingdev

最新理论框架将人工智能划分为三个核心认知维度：工具、代理和模拟器。作为工具时，AI严格遵循人类指令延伸能力边界；代理形态下则具备自主目标追求能力；而模拟器模式专精于无特定目标的流程仿真。研究表明，大型语...

2025-05-06 talkingdev

最新研究通过理论与实证分析揭示了单层Transformer模型在完成奇偶校验等复杂任务时的学习机制。研究表明，这类极简架构不仅能捕捉输入数据的配对关系，其训练动态还展现出与深层模型截然不同的特征。尤为值得注意的...