youxihw下载站:汇聚最热门软件,安全、高速、放心的专业下载站!

您现在的位置:首页 > 资讯教程 > 资讯详情

OpenAI指出,AI浏览器或许会一直面临提示注入攻击的潜在风险

2026-02-12作者:admin

尽管OpenAI正着力强化其Atlas AI浏览器的网络攻击防御体系,但该公司也坦言,提示注入这种能操控AI代理执行网页或邮件中隐藏恶意指令的攻击手段,短期内仍将持续构成风险——这无疑让人们对AI代理在开放网络环境下的安全运行能力产生了疑虑。

OpenAI在周一发布的一篇博客文章中表示:“即时注入这类问题,和网络上的骗局、社会工程手段类似,恐怕难以被彻底‘根除’,因此公司正着力强化Atlas的防护机制,以应对层出不穷的攻击。同时,公司也承认,ChatGPT Atlas所采用的‘代理模式’使得安全威胁的范围有所扩大。

OpenAI 在10月推出了ChatGPT Atlas浏览器后,安全研究人员们随即发布了相关演示,呈现出仅需在Google文档里输入几个词,就能对底层浏览器的行为产生改变的情况。而在同一天,Brave也发布了一篇博客文章,阐述间接提示注入是人工智能驱动的浏览器(其中包括Perplexity的Comet)所面临的系统性难题。

OpenAI并非唯一意识到基于提示的注入问题不会消失的机构。英国国家网络安全中心本月初就曾发出警示,指出针对生成式人工智能应用的提示注入攻击“或许永远无法彻底缓解”,这会让网站面临数据泄露的风险。该英国政府机构建议网络专业人士应着力降低提示注入的风险与影响,而非认为这类攻击能够“被阻止”。

OpenAI方面表示:“我们将快速注入视为长期的人工智能安全挑战,需要不断加强防御。”

公司对这笔西西弗斯式任务的回答是什么?公司表示,这种主动快速响应周期显示出早期潜力,有助于在内部发现新颖攻击策略,防止它们被“野外”利用。

这与Anthropic和谷歌等竞争对手所说的观点并无太大不同:为了应对基于提示性攻击的持续风险,防御必须多层次并持续进行压力测试。例如,谷歌最近的工作聚焦于代理系统的架构和策略级控制。

但OpenAI采取了不同的策略,是对其“基于LLM的自动攻击者”。这个攻击者基本上是OpenAI训练的机器人,利用强化学习,扮演黑客的角色,寻找方法偷偷向AI代理传递恶意指令。

在正式投入使用前,机器人能够通过模拟器开展测试攻击。模拟器会呈现目标AI的思维逻辑,以及它在遭遇攻击时可能做出的应对举措。之后,机器人可以分析这些反应,调整攻击策略,并进行多次尝试。由于外界无法洞悉目标AI的内部推理过程,所以从理论上讲,OpenAI的机器人应该能比现实中的攻击者更迅速地发现漏洞。

这是AI安全测试中的常见策略:构建一个代理来找出边缘案例,并在仿真中快速进行测试。

OpenAI指出:“我们通过强化学习训练出的攻击者,能够诱导代理完成复杂且具有长期影响的有害工作流程,这类流程往往需要历经数十乃至数百个步骤才能逐步展开。”“我们同时还发现了一些在人类红队行动以及外部报告里都未曾出现过的全新攻击策略。”

在演示过程中(部分相关图片可查看上方),OpenAI呈现了其自动攻击程序是怎样把恶意邮件悄悄送入用户收件箱的。之后,当AI代理对收件箱进行扫描时,它并没有按照常规去草拟不在办公室的回复,而是依据邮件里的隐藏指令发送了辞职信。不过,据该公司表示,在完成安全更新后,“代理模式”能够成功识别出提示注入的尝试,并向用户发出了标记提醒。

公司表示,虽然快速注入难以万无一失地防范,但他们依靠大规模测试和更快的补丁周期,在实际攻击出现前加固系统。

OpenAI发言人拒绝透露Atlas安全性更新是否导致成功注入数量的明显减少,但表示公司自发布前就已与第三方合作,加强Atlas防止快速注入的防护。

网络安全公司Wiz的首席安全研究员Rami McCarthy表示,强化学习是持续适应攻击者行为的一种方式,但这只是整体情况的一部分。

“判断人工智能系统风险的一个有用方法是自主性乘以访问性,”麦卡锡讲到。

“代理型浏览器往往处于这一领域的一个挑战阶段:适度自主性与极高访问性相结合,”麦卡锡说。许多当前的建议反映了这种权衡。限制登录访问主要减少风险,而要求审核确认请求则限制了自主权。”

这两项是OpenAI为帮助用户降低自身风险提出的建议内容之一,据一位发言人介绍,Atlas还经过相关培训,可在发送消息或进行支付前向用户确认。OpenAI同时建议用户向客服提供具体的指示,而非直接让客服访问收件箱并告知对方“采取任何必要行动”。

OpenAI表示:“宽松的自由度使隐藏或恶意内容更容易影响代理人,即使有安全措施。”

虽然OpenAI表示保护Atlas用户免受提示注入是首要任务,但McCarthy对风险较高的浏览器的投资回报率提出了一些怀疑。

McCarthy表示:“就多数日常使用场景而言,代理式浏览器目前还没能展现出足够的价值,来抵消其现有的风险属性。”由于这类浏览器会接触到电子邮件、支付信息等敏感数据,风险程度相当高——而恰恰是这种访问权限,构成了它们功能强大的基础。尽管这种价值与风险的平衡状态会持续变动,但在当下,二者之间的权衡依然是切实存在的。

Tags:责任编辑:admin

热门文章

  • 火环冰队的组队方法是什么

    在热门游戏里,火环冰队的搭配能带来别具一格的战斗体验。下面为大家分享一套实用的组队攻略。 核心角色选择 -火属性输出核心:挑选拥有高爆发火技能的角色,像可以瞬间施展大范围高伤害火环的角色就很合适。这类角色在战斗一开始就能对敌人造成强力攻击,快速降低敌方的生命值。 -冰属性控制型角色:拥有强力冰系控制技能的角色是队伍里必不可少的存在。这类角色可以是能将敌人冻结使其无法行动的,也可以是能制造出减速区域影响敌人移动的。借助冰属性控制效果,能够有效限制敌人的行动能力,从而为整个团队营造出良好的输出空间。 辅助型角色的作用十分关键,他们能够为队伍带来增伤、回血等各类辅助效果。举例来说,有的辅助角色可以增强火属性伤害输出,还有的能在队友生命值下降时迅速为其恢复血量。 组队搭配思路 -利用火环的高爆发伤害作为主要输出手段,在战斗开始时集中火力攻击敌方关键目标。 冰属性控制型角色可把握时机施展技能,通过冻结敌人或创造减速区域,既能阻挡敌人接近我方输出核心,又能扰乱敌方的进攻节奏。 辅助角色时刻留意队友的状态,及时为火属性输出核心提供增伤效果,助力其打出更高伤害;当队友受伤时,他们会迅速为队友回血,保障团队的生存能力。 战斗技巧 战斗开场阶段,火属性的核心输出角色率先施放大范围的火环技能,以此对敌方全体造成高额伤害;与此同时,冰属性的控制型角色同步释放冰系控制技能,将敌方前排单位或关键输出点冻结限制。 在战斗时,要依据敌方的行动来调整技能的释放时机。要是敌方冲破了我方的防线,冰属性的控制角色就得马上在他们的行进路径上释放减速或冻结技能,以此阻拦其继续前进。 -辅助角色要时刻留意队友血量,及时使用回血技能。同时,持续为火属性输出核心提供增伤效果,保持其输出能力。 -当敌方有强力技能准备释放时,提前预判,利用冰属性控制技能打断敌方技能释放,保护我方团队。 实战演练 在实际战斗里,依照上述的组队方式与战斗技巧来执行操作。持续借助实战来打磨团队之间的配合,熟练掌握每个角色技能的释放时机。经过多次战斗积累相应经验,就能让火环冰队在游戏里展现出强劲的实力,从容应对各类挑战,赢得胜利。
  • 伊瑟开服卡池该怎么选
  • 在洛克王国里怎样才能获得哭哭菇
  • 厉害的0516铃铛怎么样
  • 嘟嘟脸恶作剧里的小桃表现如何
  • 猴面小龙兰具有哪些特征?
  • 无主之地4里唱片骑师这把武器的具体效果是怎样的
  • 黑龙江全省事app养老金认证操作指南
  • 全民K歌里怎么才能只演唱歌曲的部分片段呢
  • 怎样使用台风路径查询app