AI恐自我改进 Anthropic呼吁全球暂停AI开发

高杉编译

【正见新闻网2026年06月05日】


图为示意图。摄于2025年5月16日,画面中显示着一部手机屏幕上的人工智能(AI)标志。(Oleksii Pydsosonnii /英文大纪元)

总部位于旧金山(San Francisco)的人工智能(AI)公司Anthropic周四(6月4日)发文,呼吁全球主要AI实验室考虑放缓甚至暂停最先进AI系统的开发,并警告AI正逐步接近“递归自我改进”能力,即AI系统在几乎无需人类干预情况下自行提升性能,这可能对社会构成重大风险。

Anthropic警告AI风险升高

根据Anthropic发布的文章,公司研究人员认为,全球若能做到“放缓或临时暂停前沿AI开发”,将有助于让社会治理与安全研究跟上技术发展的速度。

这篇文章由Anthropic研究院(Anthropic Institute)负责人马里纳·法瓦罗(Marina Favaro)及公司联合创始人杰克·克拉克(Jack Clark)共同撰写。

文章指出,目前人工智能模型的能力进步速度极快,正朝向“递归自我改进”(Recursive Self-Improvement)方向发展,即人工智能能够自主优化与升级自身系统,而不再需要大量人工参与。

此机制被视为AI跨越人类智慧门槛并引发“智慧爆炸”的核心关键,已成为Google DeepMind与Anthropic等顶尖实验室的研发重心。

Anthropic公司表示,目前尚未真正出现这种情况,但其到来“可能比大多数政府与机构预测得更早”。

公司指出:“现有证据表明,在人工智能开发过程中的每一步,人类的角色都在不断收窄。”

Anthropic还提出,如果希望全球真正实现暂停AI开发,就需要美国与中国等主要人工智能国家,以及一系列巨头科技公司共同参与,同时建立一套可核查的监督系统。

Anthropic的主张引发争议

Anthropic近年因推出Claude系列人工智能模型而迅速崛起,并在与OpenAI等企业的竞争中受到市场关注。

据媒体报导,Anthropic近期完成了新一轮融资,公司估值已接近1万亿美元,并已秘密启动上市程序。

不过,该公司长期强调人工智能安全问题,也在业界引发争议。

风险投资人、川普(特朗普)政府非正式顾问大卫·萨克斯(David Sacks)曾批评Anthropic公司,认为其表面以“安全”为名,实际上是试图透过监管限制竞争对手的发展。

部分批评人士还指出,Anthropic反复强调旗下最新AI模型存在潜在安全危险,也具有一定市场营销效果。

Anthropic于2026年4月推出了其最先进且神秘的预览版模型Claude Mythos(或称 Mythos Preview)。此模型展现出极为强大甚至令咨询安全界颇为震惊的自主网路安全能力。

测试证实,Claude Mythos能够自主发现并串联多个“零日漏洞”(Zero-day Vulnerabilities),其挖掘与利用安全漏洞的能力远超以往的AI模型(如 Claude 4.6 Opus等)。它甚至在各大作业系统与浏览器中,找出了隐藏数十年、连人类专家和自动化工具都未曾发现的系统安全漏洞。

由于担心该模型若被骇客武器化,并将引发灾难性的网络攻击,Anthropic拒绝向公众开放Mythos。

相反地,他们采取了严格限制的封闭发布策略,透过名为Project Glasswing的计划,将该AI模型仅提供给少数(最初约40-50家,后于2026年6月扩大至约150家)特定的大型科技公司、资安机构及关键基础设施联盟(如微软、苹果、亚马逊、CrowdStrike、欧盟资安局ENISA 等)进行防御性的漏洞修复。

Anthropic此举也被一些专业人士解读为是展示其技术实力的一种方式。

业界对AI未来仍存分歧

目前,人工智能行业对于AI是否已接近“通用人工智能”(AGI)仍存在巨大分歧。所谓AGI,是指接近、具备甚至超越人类智慧的理论系统,能够理解、学习并执行人类能完成的任何智力任务的AI系统。

人工智能领域知名学者、元平台(Meta Platforms)前首席人工智能科学家杨·勒丘恩(Yann LeCun)表示,现有的大型语言模型难以真正达到人类智能水平。他此前曾形容,目前人工智能的智能程度更接近“猫的水平”,远远不如人类。

但Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)则多次警告,人工智能可能加剧社会不平等,甚至取代大量初级白领工作。

Anthropic公司表示,未来数月将与政策制定者、研究人员及其它人工智能公司展开讨论,研究建立全球协调机制,以应对人工智能快速发展带来的风险。

(转自大纪元)

添加新评论