【文/南极土著】

6月18日有两个值得关注的事。一个是,美国商务部长卢特尼克写给Anthropic的那封信,最终还是被神通广大的彭博社拿到了副本。

事实证明,我们此前在《怎么看美国对Anthropic模型的出口管制?》中的判断基本正确:BIS真就是发了一封“告知函”(is-informed letter),叫停了Fable 5和Mythos 5的发布。

彭博社相关报道截图

在告知函中,BIS援引了三个关键的法律依据:

一是美国《2018年出口管制改革法》(ECRA)第1758(b)(1)条。这是ECRA关于新兴技术(Emerging Technologies)和基础性技术(Foundational Technologies)的核心授权条款。简单来说,这条规定赋予BIS一项先管起来再建立规则的权力。如果商务部认为某项新兴技术(例如前沿AI模型)对美国国家安全非常重要,但现有出口管制体系里还没有专门规则,BIS可以先对其实施临时出口管制(interim controls)。

二是美国法典第50章第4813(a)(15)条,即ECRA第1754(a)(15)条。该条赋予BIS给企业发出“专项通知(specific notice)的权力。即使相关技术还没有被正式列入CCL等出口管制清单,BIS也可以直接通知特定企业、个人或机构,要求其未来出口、再出口或转让相关技术时必须事先申请许可证。

三是《出口管理条例》(EAR)第744.22(b)条。可以把它理解为BIS的“兜底通知条款”(Catch-all Notice Provision)。只要BIS认为某项技术存在被用于外国军事情报活动的不可接受风险,即使出口商自己并不知道最终用途,BIS仍然可以通过发函通知或公开公告的方式,要求其必须申请许可证后才能出口。

这三项法律依据结合起来,使得BIS实际上可以把Fable 5和Mythos 5视为受出口管制的物项。在获得许可证之前,只要模型离开美国领土,或者被外国人接触到,都需要获得BIS批准。

BIS在信中明确列出了四种受管制场景:

第一种是出口(Export)。只要把模型从美国传到境外,无论是下载、上传、邮件发送、API交付、云端共享还是拷贝到硬盘带出美国,本质上都属于出口。

第二种是再出口(Reexport)。模型已经在海外后,如果再从一个国家转移到另一个国家,例如从英国传到法国、从新加坡传到阿联酋,也属于受管制的再出口。

第三种是境内转移(Transfer)。即使模型没有跨境,只是在同一个国家内从一家机构转移给另一家机构,也可能触发许可证要求。

第四种是视同出口(Deemed Export)和视同再出口(Deemed Reexport)。即使模型从未离开美国,只要向美国境内的外国公民、外国员工或外国研究人员披露模型权重、参数、源代码或相关技术信息,法律上就被视为向其所属国家出口。同样,在第三国向外国人披露这些信息,也可能构成视同再出口。

对于Anthropic而言,要命的恰恰是第四种情况。硅谷AI行业高度依赖国际人才,许多核心研究人员本身就是中国籍或其他非美国籍人士。一旦受到“视同出口”限制,这些员工按照美国法律将无法继续接触Fable 5和Mythos 5,也无法参与这些模型的训练、维护、评估和部署等工作。

这意味着,Anthropic如果想继续推进这两个模型,可能不得不组建一支几乎完全由美国公民或绿卡持有人构成的团队。然而现实情况是,目前美国前沿AI领域的大量顶尖研究人员本身就是国际人才,有的统计甚至说七成是中国籍。要在短时间内找到足够数量、同时具备相关能力的美国籍工程师和研究员,实非易事。

因此,从合规角度看,Anthropic最稳妥的选择只能是先暂停这两个模型的对外服务,并同时切断所有外籍人士(无论是外部用户还是公司内部外籍员工)对模型的访问权限,以避免触犯美国出口管制规定而面临民事或刑事处罚。

Anthropic在其官网上表示,“我们必须立即为所有客户禁用Fable 5和Mythos 5,以确保合规。”

Anthropic这件事,也在美国引发了一场政策辩论:到底应不应该对前沿大模型实施出口管制?

在这场讨论中,不少人都提到了美国当年对加密技术(Encryption)的出口管制经历。

20世纪90年代,美国曾把强加密技术视为战略物资,管理方式几乎和导弹、军工产品类似。美国政府担心,如果高强度加密软件流向国外,外国军队、情报机构甚至恐怖组织将获得更强的保密通信能力。因此,美国长期限制加密软件和加密算法出口,最著名的例子包括128位以下加密限制以及后来饱受争议的“Clipper Chip”计划。

但管着管着,美国发现事情并没有按照预想发展。

首先,加密技术本质上是数学。和光刻机、芯片制造设备不同,算法和代码极易传播。很多核心加密算法本来就是公开发表的学术成果,相关论文全世界都能看到。美国即使禁止出口软件,也无法阻止外国研究人员根据公开论文自行实现类似功能。

其次,美国企业开始强烈反对。随着互联网在90年代迅速普及,微软、思科、网景、IBM等公司发现,全球客户越来越需要强加密产品来保护商业数据和网络通信。但由于出口管制,美国企业只能向海外市场提供“弱加密版”产品,而欧洲、以色列等地的竞争对手却能够提供更安全、更有吸引力的解决方案。结果反倒是美国企业失去了市场份额。

更重要的是,美国政府逐渐意识到,加密不仅是一项国家安全技术,更是数字经济的基础设施。没有强加密,网上银行难以建立,电子商务难以发展,云服务无法获得用户信任,美国互联网企业的全球扩张也会受到严重限制。

到了90年代后期,华盛顿终于开始重新思考这套逻辑。2000年,克林顿政府基本想明白了一件事:与其拼命阻止别人获得加密技术,不如确保美国企业始终是全球最先进加密技术的提供者。随后,美国大幅放宽了强加密技术的出口管制。

事后来看,这是一项相当明智的政策调整。美国后来在互联网、云计算、网络安全和数字经济领域获得的巨大收益,远远超过了当年通过出口管制可能获得的安全收益。

正因如此,今天不少美国学者和产业人士认为,AI大模型或许也会走上类似的道路。随着模型能力不断扩散、开源生态不断成熟以及全球研究力量持续追赶,前沿大模型最终可能像加密技术一样,成为一种广泛普及的通用技术(General Purpose Technology)。在这种情况下,过度依赖出口管制未必能够长期维持美国优势,反而可能削弱美国企业的国际竞争力,并促使其他国家加快自主研发和替代方案建设。

我个人比较认同这一派的观点。

对大模型实施出口管制有一个隐含前提:模型能力很容易被其他国家直接“拿走”或者“复制走”。但这个前提本身未必成立。

就拿最近被频繁提起的“蒸馏”(Distillation)来说,美国现在多少有些把这件事神化了。华盛顿的很多讨论里,蒸馏仿佛成了一种能够迅速复制甚至赶超美国模型能力的黑科技,以至于已经有国会议员开始认真讨论专门针对模型蒸馏的立法。

但如果把这层窗户纸捅破,所谓Anthropic反复提到的“对抗性蒸馏”,本质上不过是一种获取高质量训练数据的办法。说到底,就是利用更强模型生成的答案、推理过程和样本数据,来弥补自身数据储备不足的问题,而不是把模型本身复制过来。蒸馏获得的主要是数据,而不是参数和能力本身。

这就跟一个很反直觉的事实有关。过去几年,一直不停有人说,中美AI竞争中,中国具有数据上的优势,好像人多了数据就一定会多、就一定会对模型训练有用。事实上,中国在通用大模型训练所需的数据供给上并没有很多人想象中那么大的优势。相反,美国长期积累起来的数据服务产业、内容授权体系和专业数据市场,其成熟度至今仍然领先于中国。

这也是为什么Anthropic公开点名的几家中国机构,很多是创业公司和AI实验室,而不是互联网大厂。因为相比拥有海量用户数据、搜索数据、视频数据和商业数据的大厂,这些创业公司往往更缺优质训练数据,因此更有动力通过蒸馏等方式补齐短板。对于本来就掌握大量数据的大厂而言,蒸馏的重要性远远没有外界想象得那么高,有些公司估计会还觉得有害。因为它们缺的未必是数据数量,而更多是算力。