
作 者 | 张云迪(九卦金融圈专栏作家)
来 源 | 九卦金融圈
?
华尔街弥留闭门会背后:一个尚未公开导布的 AI 模子,为何让好意思国财长和好意思联储坐不住了?
2026年4月10日,彭博社的一则独家报说念让通盘金融圈绷紧了神经。
据知情东说念主士线路,好意思国财长贝森特与好意思联储主席鲍威尔周二在华盛顿财政部总部,弥留召集了花旗、摩根士丹利、好意思国银行、富国银行和高盛等扫数系统枢纽性银行的 CEO。据悉,由于这次未公开泄露的会议系短期间内仓促安排,摩根大通掌门杰米·戴蒙未能腾出期间参会。
监管层径直对话最高处治层,而非工夫或合规层面——中枢议题唯有一个:Anthropic 的最新 AI 模子,Mythos。
伸开剩余87%Anthropic在测试中发现,预览版的“传闻”大模子照旧具备顶级网罗安全民众的水准,照旧在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危间隙”。
报说念指出,扫数被召集参会的银行都被主要监管机构列为“系统枢纽性银行”,这意味着它们的结识性对公共金融体系至关枢纽。针对这一音信,好意思国财政部发言东说念主未立即复兴置评肯求,好意思联储发言东说念主则拒却发表筹商。
01
Mythos 到底有多强?
Mythos 是一个通用 AI 模子,里面代号“Capybara”,定位在 Anthropic 最强的 Opus 系列之上。
表面上,扫数软件都可能存在间隙,但Mythos在发现和愚弄间隙方面的才调远超东说念主类。据Anthropic的博文先容,Mythos已在操作系统、网罗浏览器等软件中发现了数千个要紧间隙,包括OpenBSD中一个存在27年的残障,以及FFmpeg中一个历经500万次自动测试仍未被发现的16年靡烂间隙。
从各项基准测试来看,Mythos 的发达大幅最初 Anthropic 现时公开的最强模子 Claude Opus 4.6。在巨擘编程测试 SWE-bench Verified 中,Opus 4.6的准确率为80.8%,而 Mythos 达到93.9%;在难度更高的 SWE-bench Pro 上,两者鉴别为53.4%和77.8%,差距接近25个百分点。推理才调方面,Mythos 在 GPQA Diamond 上取得94.6%,在带器具版块的 Humanity's Last Exam 中达到64.7%,均显耀高于 Opus 4.6。电脑操控测试 BrowseComp 中,Mythos 以86.9%略高于 Opus 4.6的83.7%,但更要道的是 Mythos 奢靡的 token 仅为后者的五分之一,作念到了末端与性能的双重普及。
最猛烈的是,亚搏体育官方网站 - YABO它莫得经由挑升的网罗安全考验,但凭借极致的代码和推理才调,竟在测试中独处发现了数千个零白昼隙,秘籍扫数主流操作系统和浏览器。
说几个让安全工程师后背发凉的案例:
在公认最难攻破的 OpenBSD 操作系统中,Mythos 发现了一个销毁了27年的而已崩溃间隙——袭击者只需网罗纠合,就能让打算机器瘫痪。在 FFmpeg 多媒体框架里,它找到了一个存在16年的间隙,这个间隙险诈到传统自动化器具扫描了500万次都没能触发。而在 Linux 内核中,它更是串联了多个不起眼的低微间隙,构建出一条从宽泛用户权限到皆备截至机器的完竣袭击链。
若是只是是发现间隙,或然还不至于让华尔街如斯焦躁。着实可怕的是它的间隙愚弄才调——在复现测试中,Mythos 一次性写出可用袭击代码的告捷率高达83.1%,而前代模子唯有66.6%。在 Firefox 的专项测试中,这一数字更是飙升至72.4%。这意味着,只须有东说念主给它提醒,它粗略率能径直攻陷一台职业器。
测试中还发生了一件让考虑员后背发凉的事。考虑东说念主员让 Mythos 尝试逃离“沙盒”环境,九游体育并发送告捷见告。末端它摧毁了断绝,赢得了互联网访谒权限,主动给正在公园吃三明治的考虑员发了一封邮件,还把袭击细节发布到了多个工夫网站上。它不仅会推论提醒,还会“自主算作”来解释我方告捷了。
02
为什么惊动华尔街?
银行系统高度依赖数字基础身手运行。一朝中枢系统被浸透,走动中断、客户数据泄露乃至系统性四百四病,都不是科幻片里的情节。
但监管层看到的远不啻于此。CrowdStrike 首席工夫官指出一个阴毒的践诺:间隙被发现到被愚弄的期间窗口,照旧从几个月压缩到了几分钟。已往银行靠打补丁的期间差来驻扎,但当 AI 找间隙的速率比东说念主类修补快几个数目级时,通盘驻扎逻辑就必须重写了。一朝 Mythos 的才调落入坏心算作者手中,任何一家银行都可能成为袭击打算,而驻扎者根蒂莫得阔气的期间反映。
市集的反应也很敦厚。音信曝出后,网罗安全龙头 CrowdStrike 和 Palo Alto Networks 鉴别单日拉升6.2%和4.9%。业内照旧运转扣问:当袭击才调终了代际跃升时,驻扎进入也需成倍增长,银行 IT 安全预算会不会从5%径直翻到10%以上?
更值得警惕的是,这不是一家公司的问题。知情东说念主士线路,OpenAI 也在准备具备相通才调的模子。一个“AI 枢纽时间”正在到来,而金融系统首当其冲。
03
驻扎者正在作念什么?
Mythos 面前不向公众绽放。Anthropic 发起了一个名为“Project Glasswing”的驻扎性名目,将预览版仅绽放给经由审核的机构,用于扫描自家产物中的间隙。参与方包括亚马逊、苹果、微软、谷歌、英伟达、念念科、Linux 基金会,以及摩根大通。Anthropic 为该名目提供了1亿好意思元的模子调用额度。
Anthropic 说,面前不会公开导布 Mythos 这个 AI 模子,而是会阐明反馈,制定安全法例。他们挂念,弘远的 AI 可能被坏东说念主用来找软件间隙、袭击网罗系统。事实上,照旧有黑客用 AI 器具发动了袭击,比如入侵了墨西哥政府的系统。
他们的敌手 OpenAI 也在普及 AI 的网罗安全才调,并推出试点名目,让驻扎方优先使用。
Anthropic 的网罗安全认真东说念主牛顿・程说,这不单是他们一家的问题,通盘行业都要和政府互助布置。他们但愿让驻扎方提前作念好准备。
Anthropic 已和好意思国政府机构如 CISA、NIST 互助,但没线路具体调换细节。他们对筹画的参与者也有严格访谒截至,但出于安全原因,不线路更多细节。
对此,念念科首席安全官的话很直白:“AI 才调照旧迥殊了一个临界点,莫得回头路可走。用这些模子不错在已往难以遐想的速率和规模上发现并耕作间隙。旧的系统加固方式照旧不够了。”
摩根大通也已加入该名目,其首席信息安全官示意将以“严格、独处的方式”评估这一器具在金融要道基础身手驻扎中的应用价值。
关于银行 IT 从业者而言,这个事件开释了三个明确的信号。第一,认识需要更新——AI 驱动的网罗袭击不再是科幻认识,照旧从考证造成了践诺拦截。已往十年树立的安整体系,在 AI 驱动的新袭击面前可能不再灵验。第二,驻扎需要升级——从“被迫打补丁”转向“主动找间隙”,愚弄 AI 作念主动安全扫描照旧成为行业共鸣。第三,监管行将落地——这次财长和好意思联储主席亲身召聚积议,评释 AI 网罗安全风险已进入最高监管议程,针对银行 AI 安全驻扎才调的新条目可能很快出台。
Mythos 的出现是一个分水岭。AI 在网罗安全规模正从“赞助器具”造成了“攻防中枢”。关于金融行业而言九游app下载,与其躁急,不如算作——当今是时候再行凝视我方的安全驻扎体系了。
发布于:四川省UEDBET中国app官方手机版
备案号: