GPT的相关内容 - 漫话开发者

2025-05-06 talkingdev

资深LLM用户自述：生成式大模型并非我的常用工具

近日，一位长期使用大语言模型（LLM）的资深用户在个人博客中分享了他的使用心得。尽管生成式LLM（如GPT系列）在业界引起广泛关注，但该作者表示自己并不频繁使用这类模型。相反，他更倾向于将LLM应用于特定场景，如...

2025-04-26 talkingdev

网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术，该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...

2025-04-24 talkingdev

马斯克旗下人工智能公司xAI推出的Grok聊天机器人近日迎来重要升级，新增了视觉识别能力。这一功能允许iOS用户上传图片或通过摄像头捕捉画面，随后向Grok提问关于所看到内容的问题。该功能与OpenAI的ChatGPT和谷歌的G...

2025-04-23 talkingdev

最新研究表明，生成式AI模型已具备在漏洞披露后极短时间内生成概念验证攻击代码的能力。以GPT-4为例，该模型成功针对Erlang SSH关键漏洞生成了有效攻击代码，整个过程仅需数小时。这一突破性进展凸显了网络安全领域...

2025-04-23 talkingdev

开发者Adi和Arnav在尝试让大语言模型（LLM）处理研究论文和说明书中的问题时，发现现有RAG（检索增强生成）系统无法有效解析PDF中的图像和图表内容，甚至GPT-4o和O3模型也表现不佳。为此，他们开发了开源项目Morphik...

2025-04-23 talkingdev

近日，科技社区热议的π0.5（Pi-0.5）模型在开放世界泛化能力上取得重要进展。该视觉语言模型（VLA）通过创新架构设计，在未见过的新场景中展现出超越同类模型的零样本学习能力。技术博客透露，其核心突破在于动态多...

2025-04-22 talkingdev

近期技术分析指出，OpenAI新一代推理模型存在明显的O3（Objective Over-Optimization）过度优化现象。研究表明，该公司在特定目标函数上的极端优化导致模型出现结构性脆弱，表现为逻辑链断裂概率上升和幻觉生成（hal...

2025-04-21 talkingdev

Meta旗下Facebook Research团队推出的ZeroSumEval Benchmark在GitHub开源，这一动态评估框架通过竞争性多智能体模拟，为大语言模型（LLM）在推理、知识储备和规划任务等核心能力维度建立了全新测试范式。该框架创新...