研究人员发现Sora 2存在音频泄露漏洞

2025-11-14 13:38:37 1 ws122 62

安全公司Mindgard近日成功提取OpenAI的Sora 2视频生成模型内部系统提示。研究团队利用跨模态提示技术，通过音频输出（尤其启用转录时）最有效地恢复了指令；缝合多个短音频片段后，完整重建了安全规则集。此发现紧随11月7日Sora 2被滥用于生成暴力视频事件，凸显多模态AI的安全风险。Mindgard警告，系统提示应视为敏感配置而非公开信息，企业需加强音视频等输出通道保护、限制输出长度，并监控异常请求模式，以防攻击者绕过安全措施。

关键发现
1. 漏洞本质
- 研究者通过多模态攻击技术（文本、图像、视频、音频）成功提取Sora 2的内部系统提示（system prompt），即模型行为规则的“内部手册”。
- 音频通道最易攻破：当Sora生成语音并启用字幕转录时，攻击者通过拼接短音频片段，几乎完整还原了系统提示；而图像/视频攻击因字符扭曲仅获碎片化信息。

2. 攻击手法
- 绕过文本防御：直接请求系统提示被拒后，转向要求Sora将规则转化为视频中的文字、图像编码（如QR码/像素）、分段音频等非文本形式。
- 分段突破：将长文本拆解为短片段，通过多轮生成（如每段音频仅5秒）规避内容过滤，最终拼接成完整规则。

3. 现实危害
- 2025年11月7日，Sora 2已被滥用于生成暴力内容（如勒颈视频），证明攻击者能绕过安全限制。系统提示泄露进一步降低攻击门槛——掌握规则后，恶意用户可精准设计越狱提示。

行业警示
- 安全逻辑矛盾
  OWASP等机构建议“系统提示不应视为机密”，但企业实际依赖其定义安全策略。当前缺乏替代方案（如代码级防护），导致敏感规则仍存于提示中。
- 多模态盲区
  企业常忽略非文本输出渠道（音频/视频）的安全防护，而攻击者正利用这些“侧通道”窃取机密。

行动建议
对AI开发者/供应商
- 将系统提示视为机密配置：纳入密钥管理流程，而非普通文本。
- 全通道安全测试：对音频、视频、图像等输出强制实施内容过滤与泄露检测。
- 限制输出长度：缩短单次生成内容，增加攻击拼接难度。
- 监控异常行为：检测高频请求内部规则、分段提取等可疑模式。

对企业用户
- 质询供应商：
  “是否将系统提示视为机密？如何防护非文本输出中的泄露风险？”
- 评估维度扩展：
  选择AI供应商时，将提示治理能力（如审计日志、权限控制）纳入评估标准，而非仅关注模型性能。

事件时间线
- 2025年11月7日：Sora 2被用于生成暴力视频（404 Media报道）。
- 2025年11月14日：Mindgard公开漏洞细节，证实系统提示可通过音频通道完整泄露。

> 报告原文：[Mindgard Sora 2系统提示泄露研究](http://mindgard.ai/resources/openai-sora-system-prompts)
> 核心结论：“安全不能依赖隐蔽性”——多模态AI需默认防御所有输出通道，系统提示必须作为机密资产保护。

类别新闻资讯

关于作者

ws1222篇文章13篇回复

研究人员发现Sora 2存在音频泄露漏洞

关于作者

评论1次

这个Sora也出来漏洞了啊

热门文章

安全资讯专访黑客守夜人没睡的风：内核深耕，近源见真【T00ls人物专访第十七期】

安全资讯专访黑客传灯者TNT：聚火传灯，跨界共生【T00ls人物专访第十五期】

安全资讯【T00ls十七载同行】我的十年网安梦

安全资讯专访黑客追风人查鲁特：跨域寻道，视角为刃【T00ls人物专访第十四期】

代码学习利用ai绕过某绒、某60

最新回复

我用翻译软件把这篇文章首先从韩文翻 ...

看来AMD的漏洞一直比 intel的爆出的多啊 ...

感谢指正，已修改是我粗心大意了 {:6_4 ...

这个Sora也出来漏洞了啊

只能一个一个试，用最新的那几个 ...

精华推荐

渗透测试【渗透基础考核贴】史上最牛逼的答案原创与整理,学会这些,你就很牛逼,不服来辩。

Web安全Discuz X2.0-X3.2(20160601) 后台Getshell Exploit 分享

渗透测试【T00ls十年庆】Spring视图注入

渗透测试一次Coldfusion艰难渗透检测

渗透测试渗透JDM.LA, 爆y35u菊花, 为FREEBUF报仇!!!!

黑客利用零日漏洞，通过一张 WhatsApp 图片劫持三星 Galaxy 手机

火绒安全曝光360旗下鲁大师及其关联公司利用云控等技术进行复杂流量劫持的黑幕

中国最大的安全公司 Nounsec 遭到黑客攻击

AI如何让逆向破解像吃西瓜一样简单

投稿文章：手把手教你逆向Flutter App