未经授权访问 Anthropic 公司 Claude Mythos 的 Discord 账号引发新的 AI 安全担忧

最后更新: 04/24/2026
作者: C 源跟踪
  • 据称,一个小型私人 Discord 群组通过第三方承包商环境未经授权访问了 Claude Mythos Preview。
  • Mythos 是一个人工智能网络安全模型,仅供 Glasswing 项目下的少数企业和机构合作伙伴使用。
  • 据报道,该组织利用命名规则、泄露的数据和承包商权限,猜测出了该模特的在线位置。
  • Anthropic公司正在调查此事,并表示目前没有证据表明其核心内部系统受到影响,但此案引发了人们对供应链和访问控制的担忧。

未经授权访问 Discord 上的 Mythos

最近披露的信息 据称有人未经授权通过 Discord 访问了 Anthropic 的 Claude Mythos 模型。 这再次引发了人工智能领域的一场艰难辩论:如何在不让攻击者轻易得手的情况下共享强大的网络安全工具?一个小型网络组织声称,尽管Mythos系统仅限于严格控制的预览版,他们仍然成功地使用了数周。

据多方报道,这起事件并非好莱坞式的惊天黑客事件,而是…… 结合承包商许可、网络调查和有根据的猜测 关于Anthropic公司将其最敏感的系统托管在哪里。对于一个旨在大规模发现和利用软件漏洞的模型而言,仅仅是外部人员可能对其进行实验这一想法,就已引起了安全专家、企业和政府的共同关注。

什么是克劳德神话以及它为何重要

Claude Mythos Preview 是 Anthropic 公司专注于网络安全的新型人工智能系统。Mythos 被宣传为一款通用型模型,拥有异常先进的功能,能够检测甚至利用操作系统和网络浏览器中的漏洞。然而,Anthropic 公司并没有将其公开发布,而是将其定位为一款用于保护关键基础设施的专属工具。

4月初,该公司推出了Mythos,这是名为“Mythos”计划的一部分。 玻璃翼项目根据该计划,只有少数值得信赖的机构受邀测试该模型。报道指出,包括亚马逊、微软、苹果、思科和英伟达在内的大型科技和企业巨头,以及高盛等金融机构,均获得了早期参与受控实验的机会。

合作伙伴们认为 Mythos 发现了大量安全问题。其中一个在事件报道中被反复提及的突出例子是 Mozilla,据报道,Mozilla 使用了该模型来…… 识别并修复数百个 Firefox 漏洞. Anthropic 也声称 Mythos 帮助发现了广泛使用的软件中数千个高严重性缺陷。

这些结果既令人乐观,也令人不安。一方面, 自动检测细微错误和配置错误 这或许有助于防御者领先于攻击者。但另一方面,简化复杂攻击技术的系统也可能成为网络犯罪的倍增器,尤其是在其防护机制或访问模型失效的情况下。

监管机构已经注意到这一点。据报道,英国人工智能安全研究所对Mythos进行了评估,并得出结论:它可以…… 在人为干预有限的情况下执行多步骤网络攻击他们有时甚至能完成一些模拟攻击链,而这些攻击链通常需要经验丰富的专业人员花费数天时间才能完成。这种评估使得人们将 Mythos 视为一个在网络风险评估方面不断突破的模型。

AI网络安全模型访问事件

Discord 群组称其入侵方式

在此背景下,一种……的出现 一个松散的 Discord 群组声称拥有 Mythos 的访问权限 这引发了人们的担忧,这是可以理解的。彭博社和其他媒体收集到的信息表明,好奇心、内部关系和开源研究相结合,绕过了原本应该非常严格的访问限制。

该团体成员参与一项活动 专门用于追踪未发布人工智能模型的私人 Discord 频道他们公开宣称的目标是试验尚未向公众开放的尖端系统。相关人员的身份尚未正式公开,但其中一名成员据称受雇于一家为Anthropic提供服务的承包商。

与承包商的关系似乎是关键所在。报道显示,此人的 作为外部供应商享有特权访问权限 这只是拼图中的一块。除了这个内部人士的帮助之外,成员们还依靠常见的互联网研究技巧来绘制 Anthropic 的基础设施图,以及之前对该公司如何命名和部署其模型的了解。

据称,另一家人工智能初创公司Mercor最近发生的数据泄露事件提供了更多线索。此次泄露事件中的信息,结合Anthropic模型之前使用的命名规则,使得Discord群组能够做出…… 关于克劳德·米索斯在线位置的“有根据的猜测”。他们没有强行闯入,而是准确地猜对了门,然后凭借与承包商环境相关的凭证走了进去。

据报道,该团队获得工作权限后,连续两周多定期使用Mythos。彭博社称已对其进行了审查。 屏幕截图和现场演示 这似乎证实了该模型确实在运行,并且能够响应未经授权用户发出的指令。另有说法称,使用相同的方法也可以访问其他未发布的 Anthropic 模型,但有关这些系统的详细信息仍然很少。

该组织声称他们对《神话》做了什么

公开场合,Discord 群组成员一直试图撇清自己与网络犯罪分子的关系。一位在相关报道中被引述的成员表示,该群组的兴趣在于…… 尝试新的人工智能模型,而不是发动攻击据他们所述,Mythos 被用于相对良性的实验,例如生成简单的网站和测试提示。

他们还表示,他们避免了可能触发Anthropic监控系统警报的高风险行为。据称,该组织没有发出明显的恶意查询,也没有进行任何会引人注目的活动,而是力求…… 在探索模型性能的同时,“低调行事”。根据现有报道,目前尚无确凿证据表明该组织利用 Mythos 来破坏现实世界的目标。

即使这些自我描述属实,此次事件也引发了安全专业人员的不安。一旦有人证明存在进入受限系统的有效途径, 模仿者可能会尝试复制这种技术。他们的动机可能截然不同。尽管第一批未经授权的用户声称并无恶意,但这并不能让那些担忧接下来会发生什么的防御者们感到安心。

这一事件也凸显了敏感信息的获取在很大程度上取决于少数人的行为。一个拥有部分权限且愿意变通规则的承包商,再加上在私人Discord服务器上的坚持不懈,显然就足以…… 破坏高风险人工智能模型的预期隔离.

Anthropic 的回应和供应商链问题

Anthropic公司已承认相关报道,并表示正在进行正式审查。该公司在一份发给媒体的声明中指出: “我们正在调查一份报告,该报告称有人通过我们的一家第三方供应商环境未经授权访问了 Claude Mythos Preview。” 措辞谨慎但意义重大。

该公司强调,在现阶段,它已经 没有证据表明该活动延伸到了其核心企业系统。 或者说其内部基础设施直接遭到破坏。通过将问题限定在供应商环境中,Anthropic 实际上是在其核心运营与连接到 Discord 群组的承包商所使用的环境之间划清了界限。

然而,正是这种区别令许多观察家感到担忧。如果可以从第三方环境访问 Mythos,那么 每个外部合作伙伴的安全态势都成为攻击面的一部分。这种情况说明了典型的供应链风险:即使公司加强了自己的网络,供应商的薄弱环节或配置错误也可能带来意想不到的风险。

这一事件也与“玻璃翼计划”的宣传方式相悖。该计划的逻辑是: 严格限制访问权限,仅允许精选的组织访问。 这样既能防止 Mythos 落入对手之手,又能保证进行有效的测试和反馈。排他性是核心理念:只有经过严格审查的主要机构才能对该模型进行探索,从而降低滥用的可能性。

如果一个非正式的Discord群组能在Mythos发布当天就开始使用它,那么这种说法就很难站得住脚了。即使目前还没有证据表明现实世界中的攻击事件与该模型有关,但这一事件表明…… 敏感人工智能系统周围的安全边界可能比预期的更脆弱。尤其是当外部承包商和合作伙伴参与其中时。

更广泛的担忧围绕“过于强大”的网络安全人工智能

抛开此案的具体细节,克苏鲁神话的故事也引出了更广泛的讨论。 模糊攻防界限的人工智能工具Mythos 被宣传为一种“盒装红队”,能够模拟复杂的攻击者,并在人类对手偶然发现弱点之前很久就发现弱点。

安全研究人员对如何解读这一宣传存在分歧。一些人怀疑,无论人工智能系统多么先进,都无法像宣传材料中声称的那样,以如此快的速度可靠地发现新的漏洞。另一些人则认为,即使这些说法部分属实,风险也依然存在。 人工智能辅助的网络攻击正变得更快、更便宜、更具可扩展性。 这是政策制定者在制定法规时需要考虑的因素。

包括云安全公司高管在内的业内人士的评论反映出他们既好奇又担忧。一方面,防御者看到了一个机会…… 在真实的攻击场景下,实现软件的自动化分析和压力测试,从而减少繁琐的工作。另一方面,他们设想,如果类似的模型被故意调整为攻击性并更广泛地传播,或者如果旨在防止有害使用的防护措施很容易被绕过,会发生什么情况。

政府机构开始将这些问题视为战略性问题,而非纯粹的技术性问题。据报道,人类学研究所已被指定为…… 美国国防部称之为“供应链风险”目前,关于该标签的具体含义以及是否可以修改,仍存在持续的讨论。国际安全机构同样将Mythos等系统视为如何处理军民两用人工智能技术的试验案例。

因此,Discord访问事件发生的时间点十分微妙。对于监管机构而言,这或许可以作为早期案例,展现监管谁能使用强大的AI模型所面临的挑战。 如何审核他们的访问权限以及提供者有哪些义务 当出现问题时,对于正在考虑使用类似工具的公司而言,这会引发关于文档记录、日志记录以及敏感环境隔离等方面的实际问题。

这对公司、用户和人工智能治理意味着什么

对于那些正在考虑采用 Mythos 或类似系统的组织而言,此次事件很可能会促使他们重新进行风险评估。其核心矛盾很简单: 使一款模型在国防领域具有吸引力的特性,如果使用不当,也可能使其变得危险。如果连受限预览版都能泄露到非正式社区,那么关于谁在实际使用这些工具的假设可能需要更新了。

从企业安全角度来看,此案凸显了审查以下事项的必要性: 包括承包商和小型供应商在内的整个准入链AI代理团队的生产部署纸面上看似完善的策略,在实际环境中可能会失效,因为人们会重复使用凭证、为了方便而偷工减料,或者将预览环境视为风险较低的环境。因此,企业可能会认为,对于直接与实时代码和基础设施交互的人工智能系统,需要更严格的隔离措施。

对于普通用户和员工而言,这个故事提醒我们,人工智能不仅仅是另一种企业软件。像 Mythos 这样的系统可以 缩短发现弱点所需的时间和专业知识这会放大任何泄露或滥用行为的影响。这种现实可能会促使企业建立新的内部培训和治理框架,明确谁可以在什么条件下查询高风险模型。

在人工智能治理方面,人们越来越希望超越自愿性准则。类似这样的事件表明,必须采取更强有力的措施。 关于访问控制、事件披露和独立审计的正式标准 对于功能最强大的模型而言,无论政策制定者选择宽松的监管还是更严格的监管,他们都可能以受限工具流入非官方渠道的案例作为理由。

对 Anthropic 公司而言,很多事情都取决于其正在进行的调查结果:包括入侵途径的具体运作方式、涉及的人员数量,以及事后实施的技术或程序变更。无论结果如何,“神话”事件已经成为相关讨论中的一个参照点。 如何将先进的网络安全人工智能限制在其创建者预期的角色范围内。以及当这种限制受到压力时会发生什么。

把所有这些线索放在一起,据称未经授权访问 Discord 的 Claude Mythos 事件凸显了尖端人工智能可以多么迅速地突破发布公告中划定的清晰界限,暴露供应商安全方面的漏洞,考验“仅限邀请”承诺的稳健性,并迫使公司、监管机构和用户重新思考如何管理这些工具,这些工具既可以加强也可以潜在地破坏他们所依赖的数字防御。

IA代理设备的设计和建设
相关文章:
IA 代理设备的开发和建设:生产和发展战略
相关文章: