雷火·竞技-Anthropic一条推文，引起群嘲

首页财产ai正文 Anthropic一条推文，引起群嘲 Anthropic于官网发了一篇博客，叫《检测及避免蒸馏进犯》，而这一条推文，引起全网群嘲。 2026-02-26 07:43 ·微信公家号：数字生命卡兹克数字生命卡兹克数字生命卡兹克 AI投资人解读· Anthropic称三家中国AI公司对于Claude举行“工业范围的蒸馏进犯”，激发全网群嘲，因其自身也曾经用盗版册本及歌曲练习模子。其2025年9月花15亿美元及解版权诉讼，2026年1月又面对音乐出书商30亿美元索赔诉讼。 · 行业竞争或者使此类争议增多；数据获取正当性界定恍惚，增长企业合规危害。总结：Anthropic事务凸显AI行业版权争议，其自身问题使其责怪缺少说服力。行业成长中，企业需器重数据获取正当合规，存眷竞争与版权危害对于自身成长的影响，建议进一步不雅察行业规范走向和企业应答计谋。内容由AI天生，仅供参考

昨天，看到了一个尤其离谱的事。

尤其成心思。

Anthropic（就是做Claude的那家公司）于官网发了一篇博客，标题起的尤其正式，叫《检测及避免蒸馏进犯》。

我原来以为是啥学术陈诉或者者新论文，点进去一看，嚯。

内容年夜意是说，他们发明了三家中国AI公司，别离是DeepSeek、Moonshot（就是Kimi的母公司）及MiniMax，对于Claude举行了"工业范围的蒸馏进犯"。

我看到我都懵了，蒸馏进犯，我说真话，这词我*次知道能这么组合于一路用的。

然后又说，造成为了庞大国度安全危害。。。

然后他们也发了一个X，直接爆了，此刻快要3000万的浏览。

最弄笑的是，这个评论区炸了。

不是那种底下歌舞升平，一片撑持Anthropic维护权益的炸。

是那种，你个Anthropic也有碧莲说他人的炸。

一条推文，引起全网群嘲，我说真话，已经经好久没有看到全球的AI圈结合起来，一路群嘲，同仇敌慨的了。。。

我顺手给各人贴几个看看。。。

有人说，你们不也最最先从OpenAI蒸馏的吗。

然后经典的梗图就出来了。

真的，底下一堆人骂的。

甚至还有有人贴出了Claude Sonnet 4.6 API输出经典问题“你是甚么模子”的图，然后发明，Sonnet 4.6说本身是DeepSeek。。。

全国模子一年夜蒸，你狷介你别用昔时蒸了DeepSeek的数据去练习啊。

给不太相识技能的伴侣注释一下甚么叫"蒸馏"。

蒸馏（Distillation）是AI行业一个很是常见的练习技能。

简朴说，就是用一个年夜模子，也就是常说的西席模子的输出来练习一个小模子（也叫学生模子），让小模子可以或许学到年夜模子的一部门能力，但体积更小、运行更快、成本更低。

打个比喻，你可以简朴的把它理解成师傅带门徒。

门徒不需要重走师傅几十年的路，只要随着师傅学，看师傅怎么处置惩罚问题，模拟师傅的思绪，就能于短期内得到不错的能力。

至在为何叫蒸馏，这个词实在是从化学里借来的。

化学上的蒸馏是把混淆物加热，让沸点低的身分先酿成蒸汽，然后冷凝网络，获得更纯净的物资。

AI里的蒸馏也是近似的意思，从一个繁杂的年夜模子里提掏出英华，灌注到一个更小的模子里。

这也是咱们常说的，为啥蒸馏的模子年夜几率总体能力是不如被蒸馏的模子的。

你可能见过一些场景，就好比每一次有新模子发布，评论区总有一堆人跑去问"你是甚么模子"之类的话。

假如模子回覆了"我是GPT-XX"或者者"我是Claude XX"，立刻就有人截图发帖："你看，套壳吧。"

这个测试要领实在挺扯淡的。

套壳是你直接挪用他人的API，包一层皮就说是本身的模子，这是棍骗。

而蒸馏是你用他人的输出作为练习数据，练习出一个全新的模子。

这个模子的权重是你本身的，推理是于你本身的办事器上跑的，跟原模子可以说已经经没有任何直接瓜葛了。

以是说，蒸馏这个事，自己实在是很正常的举动。

Anthropic本身也用蒸馏来做Claude的小模子，好比从Opus蒸馏出Sonnet，再从Sonnet蒸馏出Haiku。OpenAI也这么干，Google也这么干，各人都这么干。

问题于在，你蒸馏本身的模子没问题，但若你蒸馏他人的模子，那就触及到一个要害问题：

你获取那些练习数据的方式，正当吗？

Anthropic说这三家中国公司创立了24000个假账户来年夜范围提取Claude的输出，从某种意义上讲，这确凿违背了Anthropic它本身的办事条目。

但网友们暴乱的缘故原由也尤其简朴，就是你Anthropic有甚么脸说他人？

就像马斯克说的。

2025年9月，Anthropic告竣了一项汗青性的及解和谈，花了15亿美元。

这应该是美国版权诉讼史上*的及解金额。

Anthropic被发明从盗版网站LibGen及PiLiMi下载了跨越700万本书，用来练习Claude。

这些书都是有版权的，作者们没有赞成，也没有拿到任何人为。

对于，你没看错，Anthropic从盗版网站下书然后训模子。。。

这个案子的前因后果也挺成心思的。

2024年的时辰，三位作家，别离是惊悚小说作家Andrea Bartz、非虚构作家Charles Graeber及Kirk Wallace Johnson，这三个年夜神，把Anthropic告上了法庭。

由于他们发明本身的书被用来练习Claude，但没人问过他们赞成差别意。

厥后呢，查询拜访发明，Anthropic不只是用了这几小我私家的书，它建了一个巨年夜的中心藏书楼，方针贼离谱，是网络全球所有的书，并且要永远保留。

网络方式也颇有意思。

一部门是费钱买的，买完之后把书脊拆失，一页一页扫描，然后销毁原书。

这个操作虽然粗鲁，但咋说呢，从法令上说是正当的。

但另外一部门就相称呆逼了，从LibGen及PiLiMi这些盗版网站上下载。

LibGen是全世界*的盗版电子书网站，被列国执法机构围追切断了好几轮，但一直死而不僵。

Anthropic于2021年6月从LibGen下载了约莫500万本书，2022年7月又从PiLiMi下载了约莫200万本。

法官William Alsup于讯断中说了一句很出色的话：

"你不克不及仅仅由于声称本身有研究目的，就去拿走任何你想要的教科书。"

成心思的是，法官同时做出了两个讯断：

*，用正当采办的册本来练习AI模子，属在合理利用，不组成侵权。这个讯断对于AI行业实在是一个利好动静。

法官说这类利用是"咱们这辈子能看到的*厘革性的利用之一"，由于AI模子进修的是模式及纪律，不是要复制或者代替原作。

第二，用盗版册本来练习AI模子，不属在合理利用，组成侵权，这是Anthropic输失的部门。

法官原话是："盗版自己就是侵权，不成救药的侵权，无论你拿盗版的工具去做甚么。"

以是从这个讯断上，能看出来美国何处司法的立场，就是练习AI自己可所以正当的，但你获取数据的方式必需正当。

根据美国版权法，存心侵权的补偿金可以高达每一部作品15万美元，50万本书乘以15万美元，那就是750亿美元。固然不成能真赔这么多，但Anthropic面对的危害确凿也是无法整的级别。

以是它选择了及解，赔了15亿美元，约莫是每一本书3000美元。

但实在这还有没完。

2026年1月，音乐出书商们又对于Anthropic提起了新的诉讼，指控它经由过程BitTorrent下载了跨越2万首歌曲来练习Claude，触及的歌曲包括"Wild Horses"、"Sweet Caroline"、"Bennie and the Jets"、"Eye of the Tiger"这些经典名曲。

这个案子今朝还有于审理中，索赔金额听说高达30亿美元。

以是你看，甚么叫双标。

这就是双标。

Anthropic一边于说中国公司偷它的模子输出，一边本身于用盗版册本及歌曲练习模子。

以是啊。。。

说真话，这件事吃完瓜也就算了。

可是，有一个点，我实在还有想聊一聊。

就是于AI时代，“偷”这个字，到底象征着甚么。

由于我本身是做UI身世的，以是呢，UI圈子里，以前一直有一个很经典的故事。

昔时苹果的Mac之以是能有革命性的图形用户界面，也就是GUI，是由于乔布斯观光了施乐的帕洛阿尔托研究中央（PARC），看到了他们开发的图形界面原型，然后就"借鉴"了过来。

施乐的工程师们气患上要死，但也没措施。

厥后微软的Windows出来了，界面跟Mac长患上很像。

乔布斯大发雷霆，说比尔盖茨偷了苹果的工具。

比尔盖茨的回应贼经典：

"咱们都有一个有钱的邻人叫施乐，我闯进他家想偷电视，成果发明你已经经偷走了。"

传统意义上的偷，是你拿走了工具，他人就没有了，你偷了我的钱包，我的钱包就不见了，这是一个零及游戏。

但数据纷歧样，我复制了你的数据，你的数据还有于那儿，没有削减一个字节。

从物理意义上说，甚么都没有丢。

以是，这就引出了一个很是老的问题。

常识产权究竟是不是一种真实的产业？

有一派不雅点认为，常识产权是人类社会为了激励立异而报酬创造的轨制，素质上是一种垄断权。

托马斯杰斐逊以前说过一句话，年夜概意思就是，思惟就像火焰，我用你的火点燃我的烛炬，你的火不会变小。

假如按这个逻辑，"偷"常识产权这个说法自己就是有问题的，由于你并无拿走任何工具。

但另外一派不雅点认为，创作者支付了时间、精神及先天来创做作品，他们理应得到回报。

假如任何人均可以避免费利用他们的作品，那谁还有愿意创作？从这个角度说，"偷"常识产权就是偷走了创作者本应得到的收益。

这两种不雅点坦诚的讲，我本身作为一个创作者，我认为都有原理，人类争辩了几百年也没有定论。

但AI的呈现把这个问题推到了一个新的极度。

有人可能会说，那不还有是加害了版权吗？没错，但这内里有一个很微妙的悖论。

AI公司用盗版册本练习模子，这是背法。

AI公司用正当采办的册本练习模子，这是正当。

有人用AI公司的模子输出练习本身的模子，违背办事条目。

有一个很老的笑话：

一小我私家偷了另外一小我私家的钱包，然后钱包又被第三小我私家偷走了。*个小偷报警说本身的钱包被偷了，差人问他："你本身的钱包？？？"

19世纪的美国，是全世界*的盗版国度。其时美国不认可外国作品的版权，英国作家的书于美国被疯狂盗印，狄更斯每一次拜候美都城要骂一通。美国出书商就很是义正辞严，说，常识应该属在全人类，凭甚么要付钱给英国人？

厥后美国本身的文化财产成长起来了，好莱坞成为了全世界影戏中央，美国忽然就酿成了全球最踊跃的常识产权捍卫者。

汗青老是惊人地相似。

我不是说谁对于谁错，我只是感觉这类我可以你不行的立场，确凿也挺抽象的。

坦率的讲，AI行业此刻面对的版权问题，实在是整个技能史上重复呈现的老问题的新版本。

印刷机发现的时辰，手抄圣经的修士们抗议过，灌音技能发现的时辰，现场音乐家们抗议过，录相机发现的时辰，好莱坞抗议过。

每一一次，都有人说新技能会毁失创作者。

但每一一次，末了都找到了某种均衡。

但此次的新问题于在。

AI不只是复制及分发内容，它也于进修怎样创造新内容。

这就涉及到了另外一个更底子的问题，人类的创造力自己是可以被复制的吗？

我本身写公家号三年多了，说真话，我写的每一一篇文章，都是我读过的所有书、看过的所有影戏、聊过的所有天的某种"蒸馏"。

我没有付钱给每个影响过我的作者及创作者。

但没人会说我"偷"了他们。

由于我是人类，进修及创作是人类的基本权力。

那AI呢，AI进修人类的作品，创造新的内容，这算"偷"吗？

这就像千里镜之在人眼。

千里镜让人类能看到肉眼看不到的工具，但咱们不会说千里镜偷了星星的光。

AI让人类能处置惩罚及进修肉脑处置惩罚不了的信息量，那咱们为何要说AI偷了数据呢？

固然，这个类比也不*。千里镜不会直接输出跟星星如出一辙的工具，但AI有时辰会输出跟练习数据很像的内容。

乱糟糕糟糕的说了这么多，有点乱。

但我想表达的是，关在AI及版权的争辩，不该该简化成"偷"或者"不偷"的二元对于立。

这内里有太多的灰色地带，需要法令、伦理、技能等多个范畴的专家一路来会商。

而某些公司打着掩护版权的旗帜，更需要警惕一下。

假如只有少数几家公司可以练习年夜模子，并且这些公司还有都于美国，那对于全球的其他国度来讲，象征着甚么？

这个问题。

谜底我信赖各人都懂。

【本文由投资界互助伙伴微信公家号：数字生命卡兹克授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-雷火·竞技