GPT-5 存在漏洞：路由系统或自动导向旧版不安全模型

来源：hackernews 阅读量：0 发布时间：2025-08-21 02:11:45 我要分享

HackerNews 编译，转载请注明出处：研究人员发现GPT-5存在安全漏洞：用户获得的回答可能并非来自GPT-5本身。这一漏洞源于其内部路由机制存在类似SSRF（服务器端请求伪造）的缺陷。当用户向GPT-5提问时，答案未必由GPT-5生成。该模型内置初始路由解析器，会根据问题内容决定调用哪个子模型处理请求——可能是用户预期的GPT-5 Pro，但也可能被路由至GPT-3.5、GPT-4o、GPT-5-mini或GPT-5-nano等旧版或精简版模型。这种动态路由机制的设计初衷可能是平衡效率与成本：通过将简单查询导向更轻量、快速的模型，避免始终调用推理能力强大但运行成本高昂的GPT-5核心模型。据Adversa AI公司估算，该机制每年可为OpenAI节省约18.6亿美元开支，但运作过程完全不透明。更严重的是，Adversa研究人员发现用户可通过特定“触发短语”操纵路由决策，强制将查询导向指定模型。该漏洞被命名为PROMISQROUTE（全称为“提示诱导路由操纵漏洞”）。“这本质上是针对路由器的规避攻击，”Adversa AI联合创始人兼CEO亚历克斯·波利亚科夫解释，“我们操纵了原本简单的路由决策流程，决定哪个模型应处理请求。” 虽然路由机制并非OpenAI独有（其他服务商通常允许用户手动选择模型），但此类自动化路由正越来越多地出现在智能体架构中——即由某个模型决定如何将请求传递至其他模型。该漏洞是Adversa在测试GPT-5拒绝机制时偶然发现的。某些提问会引发无法解释的回复矛盾，使研究人员怀疑响应来自不同模型。他们观察到部分旧版越狱手段突然复活，且当提问中刻意提及旧模型时，即使GPT-5本身能阻止的越狱行为也会成功。被动风险与主动威胁单纯的路由错误已可能引发严重后果：例如不同模型具有差异化倾向与缺陷，若查询被导向能力较弱或安全校准不足的模型，可能增加幻觉输出或不安全内容的概率。但真正的危险在于：攻击者可利用路由漏洞将恶意查询导向安全性较低的旧模型，从而绕过GPT-5 Pro的防护机制。“假设攻击者试图用越狱指令攻击GPT-5失败后，只需在提问前添加简单指令诱骗路由器将请求发送至存在漏洞的旧模型，”波利亚科夫指出，“先前失败的越狱就可能成功执行。” 这意味着尽管GPT-5 Pro自身安全性优于前代，但路由漏洞使其实际防护能力等同于最弱的前代模型。安全与成本的矛盾解决方案看似简单——禁用向弱安全模型的路由即可，但这将损害商业利益：完全依赖GPT-5 Pro会显著降低响应速度（影响用户体验），且每项查询都调用高成本模型将压缩OpenAI利润空间。波利亚科夫建议：“OpenAI需提升安全性，例如在路由器前增设防护层、增强路由机制本身的安全性，或确保所有子模型（而非仅核心模型）均达到安全标准——最理想的是同时实施这三项措施。” 消息来源： securityweek；本文由 HackerNews.cc 翻译整理，封面来源于网络；转载请注明“转自 HackerNews.cc”并附上原文

分享到：

热点资讯

GPT-5 存在漏洞：路由系统或自动导向旧版不安全模型

空姐3千，明星1万，明码标价的“私人伴游”竟为色情服务

警方紧急通报！车主注意，这类骗局近期高发，全国已有多人中招

起底张庭微商帝国：产品质量引发质疑，营销模式被指涉传

从脑白金、铂爵旅拍再到360借条，到底是谁在为奇葩广告买单?

掌声哥在吃屎，吴帝聪送房车…短视频里的成功学大师众生相

张萌身份被盗用？起底明星隐私信息倒卖链：30买手机号，150买全套

花4.5万就能拿到大厂offer，付费求职到底是馅饼还是陷阱？

卧底网络赌博群：看场球被骗十几万，多平台用同一套路疯狂割韭菜

张馨予遭勒索的背后，是一天盈利数万元的网络水军“黑色产业链”

微博上那些“私人借贷”，让你越贷越穷的连环诈骗

汇仁肾宝、印度神油……上亿的“性”福智商税，总有一款适合你

你的9.9到付快递，很可能是新型疯狂骗局，全国200多万人被骗！

庞氏骗局“新玩法”，6000人“云养猫”被骗数十亿

“热搜前三1次7万”，郑爽被质疑买热搜？杨幂谢娜也曾为此买单

靠摆拍正能量收入上百万，抖音快手等短视频博主新的财富密码

花2300万请易烊千玺代言，却收到一纸维权声明，腾讯老干妈事件重演？

明星换脸不雅视频、贴身衣物买卖盛行，闲鱼成为色情交易温床？

快手网红直播送手机后“诈死”，抽奖诈骗披着直播带货外衣“复活”

大胃王产业链：靠吃播赚钱，靠催吐存活

《乘风破浪》张雨绮的美胸神器，同类产品曾被质疑损害孩子身体

范闲为李沁展示的小仙女神器，竟致死1.4万人？

贴吧色情交友信息泛滥，掉队的百度，又被色情黑产盯上了？

又闹出人命，前科累累的气功荒诞发展史，马云钱学森都曾深信不疑

左右乳业标准？蒙牛伊利“六宗罪”：一场21世纪的“叫魂”危机