
21世纪经济报谈记者肖潇
欧洲央行(ECB)常常举办依期会议,但就一个问题临时开会的情况很稀有。当地时刻5月26日,欧洲央行要紧召开了一场蚁集安全会议,申饬各大银行:最新大模子Mythos正在威迫金融系统,银行需要大幅加速安全疏漏的成立。
不单欧洲,自Mythos本年4月发布以来,全球监管层一直在忙着发出警报。先是好意思国财政部长和好意思联储主席要紧召开闭门会议,随后英国、日本、加拿大、德国等监管部门也启动把AI蚁集安全列入金融强健议题。
Mythos被视为AnthropicClaude居品线迄今能力最强的模子,在发现和哄骗软件疏漏上的发扬显赫飞升。Anthropic申饬其依然“发现暗藏了几十年的高危疏漏,包括统统主流操作系统和浏览器”,与此同期,“这种疏漏可能对经济、各人安全和国度安全酿成严重后果”。
不少东谈主把Mythos描绘为蚁集安全领域的“奥本海默时刻”。出于安全商量,Anthropic第一次阻抑模子公开,而是启动了名为玻璃之翼(ProjectGlasswing)的神气——仅向微软、苹果、摩根大通等12家好意思国巨头提供考核权,提早检测关节门径的疏漏,先把防火墙码高。
但这也让莫得考核权的地区产生了新的张惶。“欧洲银行无法使用Mythos模子,好意思国银行应该尽快与欧元区共享训戒。”欧洲央行监管委员会高层在媒体采访中催促谈。
发展和安全再次成为牢牢贴合的硬币两面:一面是猛涨的AI风险,另一面是越来越显著的技巧差距,全球金融机构最先感受到压力。
不外,由于大多数东谈主没法构兵Mythos的果真情况,当今还不成笃信蚁集安全到底会被若何颠覆。英国东谈主工智能安全参谋所(AISI)以为,当今不成断言AI立时就会击垮互联网,但不错笃信的是,东谈主们不成再把相关风险视为“几年后的问题”了,当下恰是一个关节注重窗口期。
有哪些申饬?
4月7日,Mythos官宣问世本日,好意思国华盛顿片刻召开了一场闭门会议,参会的有好意思国财政部长贝森特、好意思联储主席鲍威尔,以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。
多家外媒随后败露,这场会议的议题即是评估Mythos对银行系统辖来的冲击,以及金融机构需要启动里面大模子测试。
访佛的要紧会议,在接下来两个月席卷全球政府高层:
4月12日,英国央行、英国金融市集举止监管局和国度蚁集安全中心临时召开圆桌会议,核查Mythos可能流露的关节信息系统疏漏,条件各机构以“10倍紧迫性”招揽行动加强蚁集注重。
4月17日,加拿大央行两次主捏金融强健会议,将Mythos等AI驱动的蚁集漏洞列为要点议题。
4月末,日本财务大臣和日本三大银行会面,晓喻成立连结专组来应付金融风险,并但愿能在两周内取得Mythos的使用权。
新加坡蚁集安全局致函本国所相关键信息基础门径机构的高层,条件它们从头评估AI蚁集漏洞对现存安全体系的影响。
多种气魄暴露了一个信号:AI蚁集漏洞正在成为庞大的金融风险。银行不仅因为资金聚积而容易成为蚁集漏洞的生机方向,也因为底层的来回系统、计帐系统、客户数据库、身份考据模块,时常成立在浩大的第三方软件生态之上,其中不少中枢架构依然运行了数十年。
“要是某家大型软件供应商发布了一个补丁,那么漏洞者很有可能在短短30分钟内,就通过逆向工程找出这个补丁底本要成立的疏漏。是以补丁一朝发布,银行必须成立一套历程,确保比刻下市集快得多的速率成立疏漏。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中示意。
在他看来,当务之急是提高疏漏的修补速率。尤其关于渊博依赖传统IT架构运行的金融机构,是一次安全大考。
为什么是Mythos?
不同于面向无为耗尽者的聊天大模子,Mythos专长于编程,是Claude居品线的最新升级,也被视为最强Claude模子。
技巧讲演高傲,在软件工程测试SWE-benchVerified上,Mythos得分93.9%,上一代模子Opus4.6是80.8%;在蚁集安万能力评估CyberGym测试中,Mythos得分83.1%,也远高于Opus4.6的66.6%。
Anthropic在博客中强调,公司并莫得故意检修Mythos的蚁集安全用途,但当模子的编程、推理和自主彭胀能力同步增强后,它当然会取得更强的疏漏发现与哄骗能力。换句话说,安全风险捕捉是模子能力举座进步的副居品。
这种能力对蚁集安全到底意味着什么?Anthropic在自我讲演中提到,Mythos在昔时几周发现了数千个零日疏漏——零日疏漏指极其危机的残障,开发东谈主员必须在零日内成立。这些疏漏阴私简直统统主流操作系统和浏览器。
其中一个最受怜惜的案例来自操作系统OpenBSD。Anthropic称,Mythos发现了一个依然潜伏27年的疏漏。自1998年发布以来,OpenBSD一直被视为业内安全加固进度最高的操作系统之一,亦然全球渊博防火墙和关节门径的地基。
更值得担忧的是,Mythos找到疏漏后,亚博体育世界杯中国官网首页能进一步彭胀漏洞。Anthropic里面测试写谈,Mythos生成疏漏哄骗代码的成着力达到72.4%,前一代Opus4.6的成着力简直为零。
蚁集安全是攻防两边的均衡术,有益于漏洞者的技巧,也有益于注重者。“咱们信赖,刚劲的技巧能力最终会使注重方比漏洞方受益更多。但要是前沿现实室发布这些模子不够严慎,短期内漏洞方就可能会占据上风——尤其是过渡期,局势会很芜杂。”Anthropic写谈。
玻璃之翼(ProjectGlasswing)的计谋正成立在这种判断上:Anthropic最终决定,Mythos叛逆直面向公众怒放,而是优先向一部分大型机构提供考核权。在能力全面扩散前,先让注重方抢跑一步。
但这种作念法激发了新的担忧,要是最先进的技巧能力只向少数东谈主怒放,技巧差距也会成为一种安全风险。
首批取得Mythos权限的有12家中枢互助伙伴和40多家关节基础门径机构,简直全由好意思国科技与金融巨头组成,包括亚马逊、苹果、谷歌、英伟达、想科、摩根大通、Linux基金会等。除了好意思国,英国事咫尺唯一阐发取得Mythos预览版的政府,其渠谈来自参谋机构英国东谈主工智能安全参谋所(AISI)。
欧洲央行和监管机构尤其感到繁难,因为他们被拒却使用Mythos。欧洲央行监管着欧元区约111家最大的银行,摩根大通等华尔街大型银行的子公司依然取得了Mythos的测试版块,但欧洲监管方却无法平直构兵。
“统统相关机构王人应该取得此类技巧,幸免竞争污蔑。”德国央行行长只可在4月的公开演讲中命令。
需要垂死吗?
由于大多数东谈主于今无法平直构兵Mythos,外界关于它果真能力的判断,以及AI到底会不会颠覆蚁集安全,莫得东谈主能够给出明确谜底。
不少东谈主把Mythos描绘为蚁集安全领域的“奥本海默时刻”,值得垂死的外部案例如实不少。
比如一家蚁集安全公司Calif的参谋东谈主员,哄骗Mythos的早期版块,在macOS中发现两个此前未被记载的疏漏。这两个疏漏可被串联哄骗形成漏洞旅途,进而获取权限,不错绕过苹果最先进的内存完好性保护机制;要是再祛除其他漏洞妙技,致使可能统统阻抑一台Mac斥地。
英国东谈主工智能安全参谋所(AISI)同期拿到了Mythos和GPT5.5模子,其最新测试讲演高傲,Mythos之后,ChatGPT5.5依然成为第二个具备全自动蚁集漏洞能力的大模子。
环球体育官网登录入口讲演里有一个关节议论叫“CyberTimeHorizon(蚁集漏洞时刻跨度)”,用来计算AI能衔接、自主完成多万古刻的东谈主类使命,时刻跨度越长,意味着AI离委果的全自动黑客越近。2025年11月,团队预计这个议论每8个月会翻倍一次;到了本年2月,数字依然裁减到4.7个月;Mythos出现后,进化周期又压缩了。

但另一种怀疑声相通存在:Mythos的风险被夸大了,它很可能是AI行业常见的炒作营销。
开源器具curl的首创东谈主丹尼尔·斯坦伯格就公开抒发过质疑。通过Linux基金会,curl迤逦取得了Mythos对curl代码库的分析收尾。讲演宣称发现五个疏漏,但斯坦伯格后续核查发现,唯惟一个是果真疏漏;三个是API文档早已讲明的问题,另一个则仅仅无为Bug。
在斯坦伯格看来,AI的能力如实在进步,但距离立异性冲破仍有距离。
访佛判断也出当今Mozilla的测试中。Mozilla昔时弥远使用GPT-4和Sonnet3.5对Firefox进行安全分析,但一直受困于高误报率,很难真耿直鸿沟干涉使用。比较之下Mythos的能力进步是显著的,其一次性识别出了271个潜在疏漏。
但Mozilla同期强调,这离果真的蚁集漏洞还有一定距离,因为大多数情况下,单个疏漏并不及以攻破复杂的注重架构。更庞大的是,Mythos并莫得发现东谈主类看穿不了的安全疏漏,仅仅速率和效果大大进步了。
一个细节也能讲明问题。Mozilla团队会让Mythos生成补丁提出当作参考,但最终完成成立使命的仍然是东谈主类工程师,团队还莫得发现能够统统自动化处分的按序。
AISI对此的最终判断是:AI正在快速接近自主彭胀复杂漏洞历程的范围,而这种进化速率,显著快于传统安全行业的顺应速率,留给辞让方的缓冲时刻不会太长。
这大约才是激发忌惮的根源,当下恰是一个关节窗口期,谁能更快成立注重体系,谁就能在改日拉开差距。
进一步说,谜底不仅仅谁能注重Mythos,更是谁有能力造出下一个Mythos。在第三方模子评估榜单ArtificialAnalysis中亚博体育世界杯中国官网首页,编程模子榜单的前十名被Claude、Cursor、ChatGPT轮替承包,国内智谱的GLM-5.1为第十六名,KimiK2.6、DeepSeekV4也在前二十名。一些分析以为,中好意思之间前沿大模子的技巧差距正在减轻。