漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型,宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...

Read More
2026-04-20 talkingdev

独家揭秘:Anthropic发布Claude Opus 4.7,系统提示词更新细节曝光

在人工智能领域,系统提示词(System Prompt)是塑造大型语言模型行为与输出的核心指令,通常被各大AI实验室视为高度机密。然而,Anthropic公司却独树一帜,成为唯一一家持续公开其面向用户的聊天系统(如Claude)完...

Read More
2026-04-13 talkingdev

Anthropic以网络安全为由暂缓发布最强模型Claude Mythos,启动“玻璃翼项目”

人工智能公司Anthropic近日宣布,将不会在短期内向公众发布其最新、能力最强的模型Claude Mythos。公司声明,其决定源于对网络安全的审慎考量,认为该模型目前所展现出的网络能力过于强大,若广泛可用可能带来潜在风...

Read More
2026-04-08 talkingdev

开源|Clicky:macOS上的AI“桌面伙伴”,实时看屏、语音交互与光标指点

近日,一个名为Clicky的开源项目在GitHub上发布,为macOS用户带来了一种新颖的人机交互体验。该项目本质上是一个运行在光标侧的AI“教师”或“伙伴”,能够实时“看到”用户屏幕内容,并通过语音与用户交流,甚至能直接“指...

Read More
2026-04-08 talkingdev

开源|TriAttention:基于三角函数的KV缓存压缩技术,助力大模型长上下文推理在内存受限GPU上本地部署

近日,GitHub上开源了一个名为TriAttention的项目,其核心是一种创新的KV(键值)缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时,因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

Read More
2026-04-06 talkingdev

论文推荐|简单自蒸馏显著提升大模型代码生成能力,无需额外验证器或强化学习

一项名为‘简单自蒸馏’(Simple Self-Distillation, SSD)的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于,仅利用模型自身在特定采样配置(如温度参数和截断策略)下生成...

Read More
2026-04-06 talkingdev

开源|LLM Wiki:利用大语言模型构建动态知识库的新框架

近日,一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型(LLM)智能体中的“想法文件”,旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下,人类...

Read More
2026-04-05 talkingdev

开源|LLM Wiki:从卡帕西的“灵感文件”看AI开发者的知识管理新范式

近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page