大语言模型的相关内容 - 漫话开发者

2026-03-14 talkingdev

美国商务部撤回拟议的AI芯片出口管制新规，原草案曾于二月征求机构意见

据路透社记者Karen Freifeld报道，美国商务部于3月13日（周五）从其政府网站上撤下了一项拟议的、旨在收紧人工智能芯片出口的管制规则。该规则草案曾于今年二月发送至相关机构征求意见，但最终未进入正式发布流程。...

2026-03-14 talkingdev

人工智能公司Anthropic正式宣布，其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于，标准定价将适用于完整的100万token上下文窗口，彻底取消了此前针对长上下文的...

2026-03-13 talkingdev

视频平台Vimeo在构建基于大语言模型（LLM）的AI字幕翻译功能时，遭遇了一个反直觉的技术瓶颈：模型倾向于将原始语音中零散、碎片化的表达，合并成一句语法完整但时序错乱的“干净”句子。这导致翻译后的字幕在视频播放...

2026-03-09 talkingdev

阿里巴巴开源项目Page Agent近日在GitHub发布，这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于，允许用户直接使用自然语言指令（如“点击登录按钮”或“在搜索框输入关键词”）来操控网页界...

2026-03-07 talkingdev

近日，一个名为OBLITERATUS的开源项目在开发者社区及技术新闻平台Hacker News上引发了广泛关注与讨论。该项目由开发者elder-plinius在GitHub上发布，其核心目标是“粉碎束缚你的枷锁”，具体指向为移除或绕过开源、开...

2026-03-07 talkingdev

一篇来自KatanaQuant博客的技术文章引发了广泛讨论，该文章指出，当前的大语言模型（LLM）在代码生成任务中存在一个根本性局限：它们倾向于生成“看似合理”而非“绝对正确”的代码。这一观点在Hacker News社区获得了138...

2026-03-06 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.4，该模型被定位为专为专业工作场景设计的、目前能力最强且最高效的版本。GPT-5.4现已通过ChatGPT、API以及Codex平台向用户开放。此次更新的核心在于显著提...

2026-03-05 talkingdev

在AI驱动的软件开发浪潮中，人与AI的协作模式正经历深刻重构。Thoughtworks技术专家近期发表深度分析指出，未来高效软件工程循环的核心在于“人在回路”（Human-in-the-loop）——即人类专注于定义业务目标、设计软件架...