首页财产ai正文 Anthropic一条推文,引起群嘲 Anthropic于官网发了一篇博客,叫《检测及避免蒸馏进犯》,而这一条推文,引起全网群嘲。 2026-02-26 07:43 ·微信公家号:数字生命卡兹克数字生命卡兹克 数字生命卡兹克 AI投资人解读· Anthropic称三家中国AI公司对于Claude举行“工业范围的蒸馏进犯”,激发全网群嘲,因其自身也曾经用盗版册本及歌曲练习模子。其2025年9月花15亿美元及解版权诉讼,2026年1月又面对音乐出书商30亿美元索赔诉讼。 · 行业竞争或者使此类争议增多;数据获取正当性界定恍惚,增长企业合规危害。 总结:Anthropic事务凸显AI行业版权争议,其自身问题使其责怪缺少说服力。行业成长中,企业需器重数据获取正当合规,存眷竞争与版权危害对于自身成长的影响,建议进一步不雅察行业规范走向和企业应答计谋。内容由AI天生,仅供参考
昨天,看到了一个尤其离谱的事。
尤其成心思。
Anthropic(就是做Claude的那家公司)于官网发了一篇博客,标题起的尤其正式,叫《检测及避免蒸馏进犯》。

我原来以为是啥学术陈诉或者者新论文,点进去一看,嚯。
内容年夜意是说,他们发明了三家中国AI公司,别离是DeepSeek、Moonshot(就是Kimi的母公司)及MiniMax,对于Claude举行了"工业范围的蒸馏进犯"。

我看到我都懵了,蒸馏进犯,我说真话,这词我*次知道能这么组合于一路用的。
然后又说,造成为了庞大国度安全危害。。。

然后他们也发了一个X,直接爆了,此刻快要3000万的浏览。

最弄笑的是,这个评论区炸了。
不是那种底下歌舞升平,一片撑持Anthropic维护权益的炸。
是那种,你个Anthropic也有碧莲说他人的炸。
一条推文,引起全网群嘲,我说真话,已经经好久没有看到全球的AI圈结合起来,一路群嘲,同仇敌慨的了。。。

我顺手给各人贴几个看看。。。
有人说,你们不也最最先从OpenAI蒸馏的吗。

然后经典的梗图就出来了。
真的,底下一堆人骂的。


甚至还有有人贴出了Claude Sonnet 4.6 API输出经典问题“你是甚么模子”的图,然后发明,Sonnet 4.6说本身是DeepSeek。。。

全国模子一年夜蒸,你狷介你别用昔时蒸了DeepSeek的数据去练习啊。
给不太相识技能的伴侣注释一下甚么叫"蒸馏"。
蒸馏(Distillation)是AI行业一个很是常见的练习技能。
简朴说,就是用一个年夜模子,也就是常说的西席模子的输出来练习一个小模子(也叫学生模子),让小模子可以或许学到年夜模子的一部门能力,但体积更小、运行更快、成本更低。
打个比喻,你可以简朴的把它理解成师傅带门徒。
门徒不需要重走师傅几十年的路,只要随着师傅学,看师傅怎么处置惩罚问题,模拟师傅的思绪,就能于短期内得到不错的能力。
至在为何叫蒸馏,这个词实在是从化学里借来的。
化学上的蒸馏是把混淆物加热,让沸点低的身分先酿成蒸汽,然后冷凝网络,获得更纯净的物资。
AI里的蒸馏也是近似的意思,从一个繁杂的年夜模子里提掏出英华,灌注到一个更小的模子里。
这也是咱们常说的,为啥蒸馏的模子年夜几率总体能力是不如被蒸馏的模子的。
你可能见过一些场景,就好比每一次有新模子发布,评论区总有一堆人跑去问"你是甚么模子"之类的话。
假如模子回覆了"我是GPT-XX"或者者"我是Claude XX",立刻就有人截图发帖:"你看,套壳吧。"
这个测试要领实在挺扯淡的。
套壳是你直接挪用他人的API,包一层皮就说是本身的模子,这是棍骗。
而蒸馏是你用他人的输出作为练习数据,练习出一个全新的模子。
这个模子的权重是你本身的,推理是于你本身的办事器上跑的,跟原模子可以说已经经没有任何直接瓜葛了。
以是说,蒸馏这个事,自己实在是很正常的举动。
Anthropic本身也用蒸馏来做Claude的小模子,好比从Opus蒸馏出Sonnet,再从Sonnet蒸馏出Haiku。OpenAI也这么干,Google也这么干,各人都这么干。
问题于在,你蒸馏本身的模子没问题,但若你蒸馏他人的模子,那就触及到一个要害问题:
你获取那些练习数据的方式,正当吗?
Anthropic说这三家中国公司创立了24000个假账户来年夜范围提取Claude的输出,从某种意义上讲,这确凿违背了Anthropic它本身的办事条目。
但网友们暴乱的缘故原由也尤其简朴,就是你Anthropic有甚么脸说他人?
就像马斯克说的。

2025年9月,Anthropic告竣了一项汗青性的及解和谈,花了15亿美元。
这应该是美国版权诉讼史上*的及解金额。

Anthropic被发明从盗版网站LibGen及PiLiMi下载了跨越700万本书,用来练习Claude。
这些书都是有版权的,作者们没有赞成,也没有拿到任何人为。
对于,你没看错,Anthropic从盗版网站下书然后训模子。。。
这个案子的前因后果也挺成心思的。
2024年的时辰,三位作家,别离是惊悚小说作家Andrea Bartz、非虚构作家Charles Graeber及Kirk Wallace Johnson,这三个年夜神,把Anthropic告上了法庭。
由于他们发明本身的书被用来练习Claude,但没人问过他们赞成差别意。
厥后呢,查询拜访发明,Anthropic不只是用了这几小我私家的书,它建了一个巨年夜的中心藏书楼,方针贼离谱,是网络全球所有的书,并且要永远保留。
网络方式也颇有意思。
一部门是费钱买的,买完之后把书脊拆失,一页一页扫描,然后销毁原书。
这个操作虽然粗鲁,但咋说呢,从法令上说是正当的。
但另外一部门就相称呆逼了,从LibGen及PiLiMi这些盗版网站上下载。
LibGen是全世界*的盗版电子书网站,被列国执法机构围追切断了好几轮,但一直死而不僵。
Anthropic于2021年6月从LibGen下载了约莫500万本书,2022年7月又从PiLiMi下载了约莫200万本。
法官William Alsup于讯断中说了一句很出色的话:
"你不克不及仅仅由于声称本身有研究目的,就去拿走任何你想要的教科书。"
成心思的是,法官同时做出了两个讯断:
*,用正当采办的册本来练习AI模子,属在合理利用,不组成侵权。这个讯断对于AI行业实在是一个利好动静。
法官说这类利用是"咱们这辈子能看到的*厘革性的利用之一",由于AI模子进修的是模式及纪律,不是要复制或者代替原作。
第二,用盗版册本来练习AI模子,不属在合理利用,组成侵权,这是Anthropic输失的部门。
法官原话是:"盗版自己就是侵权,不成救药的侵权,无论你拿盗版的工具去做甚么。"
以是从这个讯断上,能看出来美国何处司法的立场,就是练习AI自己可所以正当的,但你获取数据的方式必需正当。
根据美国版权法,存心侵权的补偿金可以高达每一部作品15万美元,50万本书乘以15万美元,那就是750亿美元。固然不成能真赔这么多,但Anthropic面对的危害确凿也是无法整的级别。
以是它选择了及解,赔了15亿美元,约莫是每一本书3000美元。

但实在这还有没完。
2026年1月,音乐出书商们又对于Anthropic提起了新的诉讼,指控它经由过程BitTorrent下载了跨越2万首歌曲来练习Claude,触及的歌曲包括"Wild Horses"、"Sweet Caroline"、"Bennie and the Jets"、"Eye of the Tiger"这些经典名曲。
这个案子今朝还有于审理中,索赔金额听说高达30亿美元。
以是你看,甚么叫双标。
这就是双标。
Anthropic一边于说中国公司偷它的模子输出,一边本身于用盗版册本及歌曲练习模子。
以是啊。。。

说真话,这件事吃完瓜也就算了。
可是,有一个点,我实在还有想聊一聊。
就是于AI时代,“偷”这个字,到底象征着甚么。
由于我本身是做UI身世的,以是呢,UI圈子里,以前一直有一个很经典的故事。
昔时苹果的Mac之以是能有革命性的图形用户界面,也就是GUI,是由于乔布斯观光了施乐的帕洛阿尔托研究中央(PARC),看到了他们开发的图形界面原型,然后就"借鉴"了过来。

施乐的工程师们气患上要死,但也没措施。
厥后微软的Windows出来了,界面跟Mac长患上很像。
乔布斯大发雷霆,说比尔盖茨偷了苹果的工具。
比尔盖茨的回应贼经典:
"咱们都有一个有钱的邻人叫施乐,我闯进他家想偷电视,成果发明你已经经偷走了。"
传统意义上的偷,是你拿走了工具,他人就没有了,你偷了我的钱包,我的钱包就不见了,这是一个零及游戏。
但数据纷歧样,我复制了你的数据,你的数据还有于那儿,没有削减一个字节。
从物理意义上说,甚么都没有丢。
以是,这就引出了一个很是老的问题。
常识产权究竟是不是一种真实的产业?
有一派不雅点认为,常识产权是人类社会为了激励立异而报酬创造的轨制,素质上是一种垄断权。
托马斯杰斐逊以前说过一句话,年夜概意思就是,思惟就像火焰,我用你的火点燃我的烛炬,你的火不会变小。
假如按这个逻辑,"偷"常识产权这个说法自己就是有问题的,由于你并无拿走任何工具。
但另外一派不雅点认为,创作者支付了时间、精神及先天来创做作品,他们理应得到回报。
假如任何人均可以避免费利用他们的作品,那谁还有愿意创作?从这个角度说,"偷"常识产权就是偷走了创作者本应得到的收益。
这两种不雅点坦诚的讲,我本身作为一个创作者,我认为都有原理,人类争辩了几百年也没有定论。
但AI的呈现把这个问题推到了一个新的极度。
有人可能会说,那不还有是加害了版权吗?没错,但这内里有一个很微妙的悖论。
AI公司用盗版册本练习模子,这是背法。
AI公司用正当采办的册本练习模子,这是正当。
有人用AI公司的模子输出练习本身的模子,违背办事条目。
有一个很老的笑话:
一小我私家偷了另外一小我私家的钱包,然后钱包又被第三小我私家偷走了。*个小偷报警说本身的钱包被偷了,差人问他:"你本身的钱包???"
19世纪的美国,是全世界*的盗版国度。其时美国不认可外国作品的版权,英国作家的书于美国被疯狂盗印,狄更斯每一次拜候美都城要骂一通。美国出书商就很是义正辞严,说,常识应该属在全人类,凭甚么要付钱给英国人?
厥后美国本身的文化财产成长起来了,好莱坞成为了全世界影戏中央,美国忽然就酿成了全球最踊跃的常识产权捍卫者。
汗青老是惊人地相似。
我不是说谁对于谁错,我只是感觉这类我可以你不行的立场,确凿也挺抽象的。
坦率的讲,AI行业此刻面对的版权问题,实在是整个技能史上重复呈现的老问题的新版本。
印刷机发现的时辰,手抄圣经的修士们抗议过,灌音技能发现的时辰,现场音乐家们抗议过,录相机发现的时辰,好莱坞抗议过。
每一一次,都有人说新技能会毁失创作者。
但每一一次,末了都找到了某种均衡。
但此次的新问题于在。
AI不只是复制及分发内容,它也于进修怎样创造新内容。
这就涉及到了另外一个更底子的问题,人类的创造力自己是可以被复制的吗?
我本身写公家号三年多了,说真话,我写的每一一篇文章,都是我读过的所有书、看过的所有影戏、聊过的所有天的某种"蒸馏"。
我没有付钱给每个影响过我的作者及创作者。
但没人会说我"偷"了他们。
由于我是人类,进修及创作是人类的基本权力。
那AI呢,AI进修人类的作品,创造新的内容,这算"偷"吗?
这就像千里镜之在人眼。
千里镜让人类能看到肉眼看不到的工具,但咱们不会说千里镜偷了星星的光。
AI让人类能处置惩罚及进修肉脑处置惩罚不了的信息量,那咱们为何要说AI偷了数据呢?
固然,这个类比也不*。千里镜不会直接输出跟星星如出一辙的工具,但AI有时辰会输出跟练习数据很像的内容。
乱糟糕糟糕的说了这么多,有点乱。
但我想表达的是,关在AI及版权的争辩,不该该简化成"偷"或者"不偷"的二元对于立。
这内里有太多的灰色地带,需要法令、伦理、技能等多个范畴的专家一路来会商。
而某些公司打着掩护版权的旗帜,更需要警惕一下。
假如只有少数几家公司可以练习年夜模子,并且这些公司还有都于美国,那对于全球的其他国度来讲,象征着甚么?
这个问题。
谜底我信赖各人都懂。
【本文由投资界互助伙伴微信公家号:数字生命卡兹克授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-雷火·竞技