"人类所有知识的备份"又败诉了

安娜的档案是一个庞大的数字图书馆,收录了超过6,300万本书和大量学术论文,尽管面临多起版权诉讼。它的创建者承认违反版权法,并以20万美元的价格向AI公司出售盗版数据的访问权限。影子图书馆的存在反映了知识传播与版权法之间的结构性矛盾,尤其在合法渠道无法满足需求时,盗版成为了一种事实上的基础设施。
"人类所有知识的备份"又败诉了
type
Post
status
Published
date
Apr 21, 2026
slug
human-knowledge-backup-lawsuit-failure
summary
安娜的档案是一个庞大的数字图书馆,收录了超过6,300万本书和大量学术论文,尽管面临多起版权诉讼。它的创建者承认违反版权法,并以20万美元的价格向AI公司出售盗版数据的访问权限。影子图书馆的存在反映了知识传播与版权法之间的结构性矛盾,尤其在合法渠道无法满足需求时,盗版成为了一种事实上的基础设施。
tags
影子图书馆
数字图书馆
版权法
category
🤖科技与互联网
icon
password
提起“下载盗版书”,可能大部分人的第一反应是 Z-Library。
但今天故事的主角不是它,因为 Z-Library 早在 2022 年就被 FBI “端了”,甚至两名创始人也在阿根廷被捕。尽管它现在仍能访问,但它的运行模式与最初早已大相径庭。
2022 年 11 月,Z-Library的域名被查封的同一个月,一个叫安娜的档案(Anna's Archive)的网站悄然上线。
它的创建者化名"Anna",真实身份至今不明。在此后被泄露的法庭文件中,Anna承认自己"故意违反了大多数国家的版权法",并且清楚运营盗版图书馆的人"面临被捕的高风险","可能长达数十年的监禁",因此"非常小心不留下任何痕迹"。
但Anna还是做了。而且做得比Z-Library大得多。
到2026年3月,安娜的档案收录了6,300万本书——是Z-Library鼎盛时期的近5倍——外加9,500万篇学术论文,以及8,600万首从Spotify抓取的音乐文件。它的种子文件总量约1.1PB。它平均每天被下载超过65万次,大约是纽约公共图书馆日均流通量的10倍[2]。在它的FAQ页面上,安娜的档案将自己的使命定义为“备份全人类的知识与文化”(Backing up all knowledge and culture of humanity)——这也是本文标题的出处。它自称"人类历史上最大的真正开放图书馆"。
然后,它又快被围剿了。
2025年12月,音乐流媒体平台Spotify起诉安娜的档案未经授权抓取了近300TB的音频数据(覆盖平台99.6%的播放量),法院在被告缺席的情况下判赔3.22亿美元[3]。紧接着,2026年初,包括企鹅兰登书屋(Penguin Random House)、哈珀柯林斯(HarperCollins)在内的13家国际出版巨头联合向美国法院提起诉讼。美国出版商协会(AAP)在声明中称安娜的档案为"臭名昭著的盗版行动"(brazen pirate operation)[4]。
在诉讼文件中,出版商们引用了安娜的档案自己写在网站上的话——"被告毫不避讳地把自己称作一群'不受法律约束'的'海盗'"。
一个比全球任何合法图书馆都大的数字图书馆,没有一个国家愿意承认它的合法性。
这件事值得写一篇长文章,原因不在于又一个盗版网站被告了——盗版网站被告上法庭是互联网的日常,就像外卖骑手闯红灯一样频繁到失去新闻价值。
真正值得追问的问题藏在更深处:为什么我们早就有能力将世界上所有的知识塞进一个硬盘阵列,但法律却根本不允许我们这么做。
更耐人寻味的是,当我们扒开安娜的档案的运营细节,会发现这个自称"知识自由斗士"的组织,正在以20万美元一笔的价格向AI公司出售盗版数据的高速访问权限。盗火的普罗米修斯,同时也是圣火的二道贩子。
评论尸在《互联网是人类历史的一段弯路吗?》中曾写过:互联网的恶行某种程度上是互联网技术发展的客观必然。
影子图书馆的故事,是这个命题在知识产权领域的一个投影——当复制和传播信息的边际成本趋近于零,而我们的整个知识经济体系仍建立在"复制需要付费"的基础假设上,冲突就是结构性的,必然的。
以下,让我们从Sci-Hub说起。

1. 从手抄本到种子文件:影子图书馆三十年

“影子图书馆”(shadow library)不是互联网时代的新发明。
这个名词是一个图书馆学术语,指的是那些在正规出版和发行体系之外、未经版权持有者授权就大规模收集和分发书籍、论文等文献的数字图书馆。
它们和简单的盗版网站有一个微妙的区别:影子图书馆通常有明确的保存与传播知识的使命感,而不仅仅是为了省钱。这层自我认同让它们在道德叙事上始终占据着一个微妙的位置——它们是“海盗”,但是自认为在做好事的海盗。
1950年代的苏联,地下出版物(samizdat)以手抄和碳纸复印的方式在知识分子之间流传。那些无法通过国家审查的文学作品和学术著作,被一页一页地复制、传递、收藏。每一个参与者都清楚自己在犯法,每一个参与者也都相信自己在做正确的事。
苏联解体后,这种地下出版传统在互联网上找到了新的载体。Library Genesis(LibGen),如今影子图书馆生态中最古老的幸存者之一,其根源可以追溯到1990年代俄罗斯互联网(RuNet)上的学术共享社区。一篇发表在CrimRxiv上的学术考据论文《The Genesis of Library Genesis》[5]详细追溯了这条从samizdat到数字种子文件的暗线。
七十年后,同样的事情在互联网上以完全不同的技术规模重演。只是这一次,"一页一页"变成了"一键下载",传播范围从莫斯科的公寓扩展到了全球每一台联网的电脑。
2011年9月5日,一个名叫Alexandra Elbakyan的哈萨克斯坦研究生上线了一个叫Sci-Hub的网站。
Elbakyan生于1988年,在哈萨克国立技术大学获得信息技术学士学位,之后在莫斯科的一家计算机安全公司工作了一年,2010年加入德国弗莱堡大学的一个脑机接口研究团队。在此期间,她发现自己需要阅读大量学术论文,但每篇论文动辄32美元的下载费让她无法承受。
她后来在给美国联邦法院的一封信中写道:"当你需要浏览数十甚至数百篇论文来完成研究时,每篇32美元的收费简直是疯了。"("Payment of 32 dollars is just insane when you need to skim or read tens or hundreds of these papers to do research.")[6]
哪个大学生会没见过 Alexandra Elbakyan 这张挥手照呢?
哪个大学生会没见过 Alexandra Elbakyan 这张挥手照呢?
Sci-Hub的工作原理算不上优雅:它使用泄露或被捐赠的大学登录凭证,自动绕过出版商的付费墙下载论文,然后免费提供给任何人。据报道,Sci-Hub已经渗透了39个国家370多所大学的网络系统,其中包括剑桥、牛津、帝国理工等名校[6]。
学术出版巨头爱思唯尔(Elsevier)在2015年将Sci-Hub告上了纽约南区联邦法院——这是当时全球规模最大的版权侵权案。法院在2017年缺席判决Sci-Hub赔偿1,500万美元。同年,美国化学学会(ACS)在弗吉尼亚东区联邦法院又追加了480万美元的赔偿判决。
Sci-Hub没理。换了个域名,继续运营。
到2022年7月,Sci-Hub声称自己收录了超过8,834万篇学术文献。据Nature杂志同年发表的统计数据,Sci-Hub在中国的月下载量高达2,500万次,全球排名第一;排名第二的美国约为1,000万次[7]。
一个讽刺的细节是:美国的大学理论上已经为这些论文支付了高昂的订阅费用。但美国研究者仍是Sci-Hub的第二大用户群。部分原因是Sci-Hub比出版商自己的网站更好用——输入DOI号,几秒钟就能拿到全文PDF,不需要在出版商的付费墙面前输入任何登录信息或点击任何按钮。
一个盗版网站的用户体验碾压了正版,这本身就说明了一些问题。
当然,出版商们对此有自己的解释:Sci-Hub之所以"好用",恰恰是因为它在寄生。它使用的登录凭证来自各大高校已经付费购买的机构订阅——学生账号、研究员账号、图书馆账号,或被内部人员捐赠、或经由钓鱼攻击盗取,据报道已覆盖39个国家370余所大学,其中包括牛津、剑桥。Sci-Hub实质上是在免费享用这些机构花费数十亿美元购买的合法访问权,然后将这种"好用"免费分发给全球任何人。这是一种精巧的寄生关系:付费的高校既是Sci-Hub最大的受害者,也是它最核心的基础设施提供商——你买了门票,它开门让所有人进来。
如果说Sci-Hub是影子图书馆中的学术精英,Z-Library就是它的大众版。
Z-Library大约从2009年开始运营,最初只是Library Genesis的一个镜像站。但它逐渐扩展到了一切类型的书籍:教科书、小说、技术手册、菜谱、漫画——什么都有。到2022年被查封前,它拥有约1,350万本书和8,480万篇文章。
Z-Library真正出圈是在TikTok上。2022年,大量美国大学生在TikTok上分享如何通过Z-Library免费下载动辄上百美元的教科书。"穷人的图书馆"这个标签火了,Z-Library的流量也跟着飙升——2022年6月,月独立访客达到284万。10月,TikTok封禁了Z-Library相关的话题标签,美国作家协会(Authors Guild)向美国贸易代表提交了正式投诉。
这个流量和关注度引来了FBI。
2022年11月3日,FBI查封了Z-Library的240多个域名,并在阿根廷逮捕了两名俄罗斯籍运营者Anton Napolsky和Valeriia Ermakova,指控他们犯有刑事版权侵权、电信欺诈和洗钱罪。美国作家协会发表声明称这是"迄今为止打击在线盗版电子书犯罪的最大突破之一"。
故事到这里,本该结束了。
notion image
但2024年7月,这两名被告从阿根廷的软禁中逃脱。法官签发了国际刑警组织的逮捕令。截至本文写作时,两人下落不明。Z-Library本身也从未真正消失——它转入了Tor暗网,后来又通过为每个用户分配私人域名的方式重返公开互联网。
在FBI查封Z-Library之前的两个月,一个名为Pirate Library Mirror(PiLiMi,海盗图书馆镜像)的匿名项目已经悄悄完成了对Z-Library完整数据库的镜像备份。PiLiMi在声明中坦承自己"故意违反了大多数国家的版权法"。
Z-Library被查封几天后,PiLiMi的成员Anna上线了安娜的档案。
安娜的档案与它的前辈们有一个关键区别:它不直接托管任何文件。它是一个元搜索引擎(metasearch engine),聚合了Sci-Hub、LibGen、Z-Library以及互联网档案馆(Internet Archive)、HathiTrust、WorldCat等多个来源的索引数据。用户在安娜的档案上搜索到一本书后,会被导向第三方下载链接,或通过IPFS获取文件——IPFS(InterPlanetary File System,星际文件系统)是一种完全去中心化的点对点文件传输协议,没有任何中央服务器可以被关闭,数据只要有人保存就永远存在。
这种架构设计的用意很明确——让安娜的档案在法律上可以辩称自己只是一个"搜索引擎",就像谷歌也能搜到盗版资源一样。当然,没有哪个法官真的买这个账。
但这种架构在技术上带来了一个实实在在的好处:打不死。
你可以查封Z-Library的服务器,因为文件存储在那里。但安娜的档案的核心资产只是一堆索引数据和种子文件(torrent),它们以标准化的AAC格式(Anna's Archive Containers,AAC)发布,可以被无限复制和分发。查封一个域名,安娜的档案第二天就换一个上线——它已经先后使用过.org、.gs、.se、.li、.gl、.pk、.gd等一系列顶级域名。查封云服务商Cloudflare的nameserver,数据已经通过BitTorrent协议分散在全球成千上万台个人电脑上,它转头就切换到了俄罗斯的DDoS-Guard。
从Sci-Hub到Z-Library再到安娜的档案,影子图书馆的进化路径与盗版影视的进化路径几乎完全同构:Napster(第一代集中式MP3共享软件,被唱片公司告垮)、BitTorrent种子下载(去中心化,打不死)、Popcorn Time(自动抓取种子并在线播放,让盗版体验无限接近正版)。每一代都比上一代更去中心化,更难查杀,更具韧性。
但影子图书馆比盗版影视多了一层道德光环。盗版电影是免费娱乐,而影子图书馆号称是在免费传播"知识"——一种在人类文明叙事中享有崇高地位的东西。这层光环让围绕它的讨论永远无法简化为"抓盗版"那么直截了当。
问题是:这层光环能经得起多深的检视?

2. 版权:一项让"全人类知识备份"非法的制度

1710年,英国议会通过了《安妮法案》(Statute of Anne),人类历史上第一部现代意义上的版权法。它的初衷是打破伦敦书商公会(Stationers' Company)对出版业的垄断——在此之前,只有获得皇室特许的少数书商才有权印刷和销售书籍。《安妮法案》将这项权利从书商手中转移到了作者手中,并将版权保护期限定为14年(可续展一次)。
三百年后回看,历史的反讽浓得令人窒息:当年用来打破出版商垄断的法律工具,如今被出版商用来构筑比当年更高的围墙。
评论尸在《垄断的困境》中曾讨论过一个核心概念:有效垄断与无效垄断的区别在于,垄断者能否将市场地位转化为可持续的利润。学术出版业的垄断是一种极为特殊的有效垄断——出版商既不生产知识(研究者生产),也不为知识生产付费(政府拨款和大学经费付费),它们只控制了知识流通的渠道,然后向知识的生产者和消费者两头收费。爱思唯尔2024财年的营业利润率超过30%,高于苹果和微软。
这种垄断被版权制度赋予了完整的合法性。
一个很少被中国人注意到的历史事实:美国在建国后超过一百年的时间里不承认外国版权。
1891年之前,任何英国作家的作品一旦出版,美国出版商可以随意翻印而不需要支付任何费用。这不是一种疏忽或法律漏洞,而是一项深思熟虑的国策。当时的逻辑非常清晰:不承认外国版权,就能无偿翻印英国书籍,美国书价因此远低于欧洲,识字率随之飙升,国民教育水平上升,进而增强国力。
杜克大学学术传播博客(Duke Scholarly Communications)的一篇文章记录了这段历史。在1891年《国际版权法案》的国会辩论中,一位参议员投票反对时说出了一句如今读来颇有回响的话:"国际版权不过是一种垄断……是对人类知识的限制。"[8]
这与今天安娜的档案网站上写的宣言几乎一模一样。
区别在于:当年说这话的是美国参议员,站在国会大厦里,为美国的国家利益辩护。今天说这话的人匿名藏在加密货币和Tor网络的背后,面临数十年监禁。
为什么"全人类知识的备份"在法律上是不可能的?
答案是结构性的。要合法备份全人类的知识,你需要同时获得数百万个版权持有者的授权。这些版权持有者分散在全球200多个国家和地区,适用不同的法律体系,使用不同的语言。而且——这是最要命的——其中相当一部分版权归属已经不可追溯。
这些权属不明的作品被称为"孤儿作品"(orphan works)。它们的作者可能已经去世,出版商可能已经倒闭,版权继承链可能已经断裂。没有人知道该向谁支付版权费,但在法律上,这些作品仍然受到版权保护。你想用它们?请先找到权利人。找不到?那你就不能用。
即使是谷歌,也曾在这面墙前碰了壁。
2004年,谷歌启动了"图书馆计划"(Google Books Library Project),开始大规模扫描全球图书馆的藏书,雄心勃勃地想要建立一个可搜索的全球数字图书馆。美国作家协会(Authors Guild)在2005年提起诉讼,指控谷歌的扫描行为构成版权侵权。
2008年,双方达成了一项1.25亿美元的和解方案。但联邦法官Denny Chin在2011年否决了这项和解,理由是它将赋予谷歌"对研究者和其他人获取信息方式的重大控制权"——法官担心的恰恰是谷歌会因此形成一种新的知识垄断。
案件继续审理。2013年,地区法院判定谷歌的扫描构成合理使用(fair use);2015年,第二巡回上诉法院维持原判;2016年,美国最高法院拒绝受理上诉[9]。
历时十年,从地区法院打到最高法院。谷歌赢了——但只赢到了展示"片段"(snippet view)的权利。你可以在Google Books上搜索一本书的内容,看到包含关键词的几行文字,但你不能阅读全文。一家市值超过万亿美元的科技巨头,花了十年时间和数以亿计的律师费,最终的成果是:你可以扫描这些书,但你不能让人完整地读到它们。
孤儿作品(orphan works)问题在这里尤为尖锐。据估计,美国有数以百万计的20世纪中期出版物处于版权归属不明的灰色地带——作者已逝,出版商已散,继承人难觅,版权到期时间也无从核实。大量珍贵的历史文献、绝版学术著作和地方史料就这样被锁在这个灰色地带,没有人可以合法地将它们数字化和传播。谷歌Books项目原本可以让这批尘封的知识重见天日:没有人能跳出来索赔,道义上几乎是一次无害的数字化。但恰恰是这部分,在法律上最难处理——版权持有者的游说让任何试图系统解决孤儿作品问题的立法提案都胎死腹中。
作为对比,安娜的档案的6,300万本书是美国国会图书馆编目藏书(约1,700万册)的近4倍。安娜的档案非法,国会图书馆合法。区别仅在于:后者不允许你把书带回家。
从制度设计的角度看,版权法创造了一个悖论:人类创造的知识越多,合法备份它们就越不可能。每一本新书的出版都会让"全人类知识备份"的授权难度增加一个微小但确定的增量。这不是任何人的阴谋。这是一套诞生于手抄本时代的制度,在数字复制时代的结构性失灵。

3. 盗火者卖火:当海盗遇见AI

2025年初,英国音乐人和版权倡导者Ed Newton-Rex在X(原Twitter)上发布了一张截图。截图显示,当一位研究者向安娜的档案咨询AI训练数据的价格时,对方开出的报价是20万美元(要求以加密货币支付),可获得1.4亿文本的高速SFTP访问权限[10]。
notion image
安娜的档案在自己的网站上声称,截至2025年1月已经向约30家公司提供了这种高速访问服务,其中大部分是中国公司——包括大语言模型公司和数据中间商。中国AI公司DeepSeek的VL模型部分训练数据就来自安娜的档案。
一个自称"知识应该免费"的组织,在以20万美元一笔的价格向商业公司出售知识。这笔钱没有一分流向原始创作者。
安娜的档案甚至主动招揽客户。它在网站上发布了一篇标题为"If You're an LLM, Please Read This"(如果你是一个大语言模型,请读读这篇文章)的帖子——这篇文章的目标读者不是人类,而是正在爬取网页内容的AI训练程序。
这不是唯一一个把手伸进影子图书馆的AI巨头。
2025年2月,一桩针对Meta的版权诉讼中解封了一批内部邮件。邮件显示,Meta通过安娜的档案的种子文件下载了超过81.7TB的数据(其中35.7TB来自Z-Library和LibGen),用于训练其大语言模型LLaMA。原告律师团(包括作家Richard Kadrey和Sarah Silverman)指控Meta CEO扎克伯格本人授权了对影子图书馆数据的使用。据The Atlantic 2025年3月的调查报道,这不是个例——AI行业对盗版数据的使用已经是系统性的[11]。
法院在2025年6月的部分裁定中出人意料地偏向了Meta,认定AI训练对原作"具有高度变革性"(highly transformative),因此构成合理使用。但审理此案的法官Vince Chhabria特意补充了一句——这句话比判决本身更值得品味:"这个裁定并不意味着Meta的行为事实上是合法的"("this ruling does not mean that Meta's actions were in fact legitimate"),只是原告"未能提出有力的论证"。
他还点出了一个原告没有追击、但他认为具有说服力的论点:"市场稀释"(market dilution)——"通过用受版权保护的作品训练生成式AI模型,公司正在创造某种东西,它往往会极大地破坏这些作品的市场。"
另一条线索来自Nvidia。据TorrentFreak报道,法庭文件显示Nvidia高管授权从安娜的档案获取数百万本盗版书籍用于AI训练。Tom's Hardware的报道描述了Nvidia"试图与安娜的档案达成大规模盗版书籍的高速访问协议"的细节[12]。
让我们把三方的立场摆到台面上。
安娜的档案的立场是"知识应该自由",但它向AI公司收费20万美元。出版商的立场是"保护作者权益",但它们的定价让发展中国家的研究者买不起论文。AI公司的立场是"训练数据应该属于合理使用",但它们用盗版数据训练出的模型正在产生商业利润。
三方都在说"为了知识"。三方都在吃创作者的肉。
这让人想起音乐行业走过的那条路。
1999年,全球音乐产业收入约220亿美元。Napster上线后引发的盗版浪潮,将这个数字在十几年内砝到了不足150亿美元。Napster说"音乐应该免费"。
然后Spotify来了。它确实让用户几乎免费地听到了音乐,行业收入也逐步回升。但盗版浪潮的果实最终由谁接住了呢?不是音乐家。2025年的数据显示,Spotify每次播放支付给艺术家约0.004美元。一位音乐人要在Spotify上挖到美国最低工资,每月需要约35万次播放。据Los Angeles Times 2024年的报道,Napster被描述为"创造了一个比音乐产业更大的怪物"。过去十年,全球流媒体音乐总收入从不足30亿美元增长到超过260亿美元,涨了近十倍。但同期,美国独立音乐人的平均年收入并没有同比增长,大量人仍需依靠其他工作维持生计。平台变大了,但创作者没有变富[13]。
Napster说"音乐应该免费",最终接住果实的是Spotify。影子图书馆说"知识应该免费",最终接住果实的是AI公司。
两次"解放"的结果都一样:创作者的处境没有变好,变好的是新一代的中间商。
盗火者悖论的核心在这里浮出水面——如果知识真的可以"完全免费自由传播",谁来为创造新知识买单?当盗火者自己开始卖火的时候,这个悖论就从哲学命题变成了一桩价20万美元的生意。

4. 知网与Sci-Hub:同一个悖论的中国切面

上面讲的一切,对中国读者来说并不遥远。中国有一面更近、更尖锐的镜子——知网。
中国知网(CNKI)是中国最大的学术文献数据库,由同方知网运营,背后有清华大学的资源支撑。它的商业模式与全球学术出版巨头爱思唯尔高度同构:以极低的价格(甚至免费)获取学术论文的授权,然后将这些论文打包后以高昂的价格卖给大学和研究机构。
区别只在于,爱思唯尔是一家荷兰上市公司,知网有清华大学背书——同方知网的实控股东是清华控股,清华大学是其背后实质上的靠山。
两者的商业闭环高度相似:研究者用纳税人的錢做研究,将成果免费或低价投给数据库,数据库将其打包后再以高价卖回给纳税人供养的大学。中间的那一层,是唯一真正赚到錢的人。
2021年12月,89岁的退休教授赵德馨因自己的百余篇论文被知网擅自收录(从未获得本人授权,也从未支付过任何稿酬),将知网告上法庭。据央视新闻报道,赵德馨胜诉,法院判决知网赔偿70余万元[14]。
知网的回应是:下架赵德馨的全部论文。
这个结局的荒诞程度值得反复哀嚎。一位89岁的学者,为了维护自己的知识产权打赢了官司。作为"惩罚",他的全部学术成果从中国最大的学术数据库中消失了。一个为了保护作者权益而发起的诉讼,最终的结果是作者的作品变得更难被找到。
这与安娜的档案被查封后知识变得更难获取,是完全同一个结构性困境——只是一个发生在中国的学术体制内,另一个发生在全球互联网上。
赵德馨案只是知网争议的冰山一角。据中新网报道,2022年4月,中国科学院因无法承受知网高达千万级的年订阅费用,宣布停用知网[15]。中国最高学术机构买不起自己国家的学术数据库订阅——在世界范围内,这都成了新闻。同年,市场监管总局对知网立案反垄断调查,据法治网报道,最终开出了8,760万元的罚单。
与此同时,中国是Sci-Hub在全球最大的用户群。根据Nature杂志2022年的数据,中国用户每月从Sci-Hub下载2,500万次学术论文,遥遥领先于全球其他国家。
这个数字说明一件事:中国学术体系对影子图书馆的依赖是系统性的,而非个别行为。
知网的定价对许多研究者来说过于昂贵(尤其是独立研究者和小型机构),国际出版商的期刊订阅费就更不用说了。当正规渠道的价格超出了使用者的支付能力,影子图书馆就成了事实上的"基础设施"。
赤潮在《二次元,大写的爱》中记录过B站早期靠盗版内容起家、后来逐步正版化的过程。影子图书馆的故事与之有结构上的相似——当一个领域的正版渠道定价过高、供给不足时,盗版会自发填补空缺,并在使用者心中获得道德正当性。B站用户当年不觉得看盗版番剧有什么错,今天使用Sci-Hub的研究者也不觉得下载免费论文有什么错。
但B站最终找到了商业化的出路(尽管过程曲折),学术出版体系的"正版化"却遥遥无期。
2018年,由28个研究资助机构组成的联盟cOAlition S发起了"Plan S"计划,要求从2021年起,所有接受公共资助的研究成果必须以开放获取(Open Access)方式发表。听起来很美好。但Science杂志2025年的报道指出,cOAlition S的新五年战略(2026-2030)已经"缺乏牙齿"——放弃了严格的强制要求,转向了协商式推进[16]。信息学家Stefanie Haustein评价说:"我本希望看到更具颠覆性的东西,这正是联盟成立之初的精神。"("I would have hoped for something more disruptive, which was the spirit of the coalition's beginning.")
合法的开放获取进展如此缓慢,而影子图书馆每天76万次的下载量稳如磐石。当体制内的改革速度追不上体制外的需求规模,"海盗"就永远有存在的土壤。
值得注意的是,Plan S的覆盖范围主要集中在自然科学领域——物理、生物、医学。社会科学和人文学科几乎没有被纳入议程,而这恰恰是影子图书馆中书籍下载量最大的领域。
一个为解决问题而生的运动,连覆盖问题全貌的野心都失去了。

5. 结语

2008年,一位名叫Aaron Swartz的美国程序员写下了《游击队开放获取宣言》(Guerilla Open Access Manifesto):
"信息就是权力。但就像所有权力一样,有人想要独占它。"("Information is power. But like all power, there are those who want to keep it for themselves.")
三年后,Swartz潜入麻省理工学院(MIT)的一间网络机柜,用一台笔记本电脑从学术数据库JSTOR下载了480万篇论文。联邦检察官以计算机欺诈罪起诉他,可能面临最高35年的监禁和100万美元的罚款——量刑之重,超过了许多暴力犯罪。起诉所依据的《计算机欺诈和滥用法》(Computer Fraud and Abuse Act,CFAA),诞生于1986年,本是为了打击以营利为目的的黑客犯罪,却被用来威慑一个没有任何商业目的、只是想让公共资助的学术研究回归公众的年轻人。互联网先驱Lawrence Lessig在他去世后写道,法律体系选择起诉Aaron,却没有选择解决制度本身的问题。工具没有变,只是换了打击对象。
2013年1月11日,Aaron Swartz在纽约的公寓中自杀身亡,年26岁。
Sci-Hub的创始人Elbakyan说,Swartz的宣言直接启发了她。十五年后,那篇宣言催生出的这棵树——从Sci-Hub到Z-Library到安娜的档案——长成了一个每天被下载76万次、向AI公司报价20万美元的庞然大物。
在一个人类已经有技术能力备份全部知识的时代,我们的制度却让这件事只能由"海盗"来做。而海盗——正如我们所见——也不是什么好人。
那么,谁来做?

参考文献

[1] Z-Library, Wikipedia. https://en.wikipedia.org/wiki/Z-Library
[2] Anna’s Archive, Wikipedia. https://en.wikipedia.org/wiki/Anna%27s_Archive
[3] “Anna’s Archive Loses $322 Million Spotify Piracy Case Without a Fight,” TorrentFreak, 2026. https://torrentfreak.com/annas-archive-loses-322-million-spotify-piracy-case-without-a-fight/
[4] “Publishers File Suit Against Notorious Pirate Site Anna’s Archive,” Association of American Publishers, 2026. https://publishers.org/news/publishers-file-suit-against-notorious-pirate-site-annas-archive/
[5] Balazs Bodo et al., “The Genesis of Library Genesis,” CrimRxiv. https://www.crimrxiv.com/pub/9tgl8fnu
[7] Richard Van Noorden, “Giant, Free Index to World’s Research Papers Released Online,” Nature, 2022. https://www.nature.com/articles/d41586-022-00556-y
[8] Kevin Smith, “Some Radical Thoughts About SciHub,” Duke Scholarly Communications, 2016. https://blogs.library.duke.edu/scholcomm/2016/03/03/some-radical-thoughts-about-scihub/
[9] Andrew Albanese, “Hail and Farewell to the Google Books Case,” Publishers Weekly. https://www.publishersweekly.com/pw/by-topic/digital/copyright/article/70326-hail-and-farewell-to-the-google-books-case.html
[10] Ed Newton-Rex, X (Twitter), 2025. https://x.com/ednewtonrex/status/2014275604489605319
[11] Alex Reisner, “The Unbelievable Scale of AI’s Pirated-Books Problem,” The Atlantic, 2025. https://www.theatlantic.com/technology/archive/2025/03/libgen-meta-openai/682093/
[12] “Nvidia Contacted Anna’s Archive to Secure Access to Millions of Pirated Books,” TorrentFreak. https://torrentfreak.com/nvidia-contacted-annas-archive-to-secure-access-to-millions-of-pirated-books/
[13] Sam Dean, “Napster, Spotify, Facebook, Uber, Airbnb: Inside the 1999 Project,” Los Angeles Times, 2024. https://www.latimes.com/entertainment-arts/music/story/2024-05-29/napster-spotify-facebook-uber-airbnb-1999-project
[14] 《89岁教授起诉知网维权胜诉》,央视新闻,2021年12月。https://news.cctv.com/2021/12/12/ARTI3Ew4bVU4N0NAR4VQecwS211212.shtml
[15] 《中科院因近千万续订费用停用中国知网》,中新网,2022年4月。https://www.chinanews.com.cn/cj/2022/04-21/9734799.shtml
[16] Jeffrey Brainard, “After cOAlition S Disrupted Scientific Publishing, a New Plan Retreats from Strict Requirements,” Science, 2025. https://www.science.org/content/article/after-coalition-s-disrupted-scientific-publishing-new-plan-retreats-strict-requirements

📢
订阅赤潮
notion image
赞助商
这里是一个留空的位置,用于插入广告。
 
上一篇
44%的歌是AI写的,但没人在听……吗?
下一篇
十年幻师,一间没有酒鬼的酒吧
Loading...