在国内,超过8成的网络文学作者都遭遇过作品被盗版。
这是一个有巨大产值的行业,全国有约5亿网文读者,约两千万作家赖以生存。尽管有大量的作品被改编为影视、游戏、动漫,还有大量作品输出海外,被翻译成多国语言,但所有的一切,都是建立在网络作家们20年笔耕不辍,文字一个一个“码”出来的基础上。
然而,由于文字的特殊性,网络文学是盗版成本最低的内容形式之一。特别是代码爬虫等技术的出现,让网文盗版进入一种吊诡的“工业化”状态。
即使带有时髦和神秘色彩,写网文作为一种脑力劳动,依然遵循几千年来的基本规律:构思一个故事,收集素材,然后写出来。从这点来说,公元前5世纪的希腊剧作家欧里庇得斯和年的一位中国网文作者,似乎没有本质区别。
只不过网络时代一切更快。更快的创作,更快的激励,更快的沮丧。
没有什么比自己的作品被偷走更让人沮丧。于是,一边是上千万作者,一边是盗版商的自动抓取系统;一边是血肉之躯,一边是工业化;一边是人,一边是代码……
这是一场必败的战争吗?
“我们的目的就是逼死作者”
有一段时间,网文作品的更新经常在半夜,这种黑白颠倒并非仅因为创作者总在黑夜中文思泉涌,而是因为有人要来“偷东西”。
年,作家剑舞秀写处女作《我来自阿斯嘉德》时,就发现作品被盗版了。“收藏达到5万时,订阅都不到1千”,剑舞秀对界面新闻说。“收藏”,意味着5万人想看他的作品连载;“订阅”则意味着真金白银付费的有1千人。
按照正常的行业经验,“盗版至少偷走了我一半的收入。”剑舞秀说。
自动抓取,带有一种工业式的冷酷。顾名思义,只需一套爬虫代码,盗版系统就会自动在正版网站上抓取内容,次数可以是无限。作者更新完成,盗版抓取几乎瞬间同步。如日月更替一般顺滑。
“盗版读者比正版读者更快看到作品”,作为一种普遍的现象,几乎只发生在网络文学行业。
一切的灰色地带,都有所谓的“土方子”。网文行业的防盗土方就是趁读者都睡了,先发布一个前言不搭后语的假章节,等盗版商自动抓取后,过半小时再替换上正确版本。
每天熬夜更新后,剑舞秀的平均订阅数很快翻了一倍。
不过,好日子不长久。本质上,偷东西的不是代码,而是人。一旦发现有人在抵抗代码,另外的人往往不吝展示最大的恶意。
“盗版商”真人来了。作品留言里出现了这样的战书:“我们会24小时人工守着,只要更新就立刻盗取,以示惩戒。”
最后,“盗版商”只留下一句话,“我们的目的就是要逼死作者,能逼死一个烂尾一个,我们就逼死一个。"
盗版商在网文论坛中的留言
坚持了4个月后,剑舞秀宣布战败投降。土法防盗会造成阅读体验恶化,导致部分正版读者感到不爽。盗版商那边的人工蹲守,则似乎永不停歇。
“要开战!?”
《年中国网络文学版权保护与发展报告》显示,截至当年12月,盗版平台月活人数高达万。
对于盗版商来说,这万人是流量,是广告,是真金白银。意味着搭建一个盗版网站后,只要盗来内容,然后接入一个合法的互联网广告代理,每天就可以依靠庞大的访问流量躺着收钱。
上述报告还披露,年,中国网络文学盗版损失保守估计约占市场规模的17.3%。这一数值超过76%的A股上市公司在年的营收。
很长时间里,网络文学经常被称赞为一种正向的商业模式,源于起点中文网于年首创的付费体系。20年过去了,付费阅读依然被认为是一种稳定的、可持续的良性商业模式——也是吸引一个人,无论他或她是大学教授、警察,抑或农民、工人、普通学生,去成为一名网络作家的源动力。
对于绝大部分人来说,有收入,比文学梦重要。
盗版横行的状况,让程武倍感不安。年,他成为阅文集团首席执行官。这家国内代表性的网文平台,旗下拥有起点读书、QQ阅读等数字阅读产品,也运营出《庆余年》《赘婿》等知名网络文学IP。
基于10余年互联网及内容行业的从业历程,程武相信内容产业的价值与文化价值、社会价值等不可分割,而这一切都是建立在正版的基础上。没有正版阅读建立起作家收入的正反馈,创作有生力量将逐渐萎缩,产业发展也面临溃败。
入主阅文后,程武高调提出“正版联盟”等举措,而在心底里,他希望把反盗版做的更大一些,也许是一场暴风骤雨,也许是一次漫长的远征。
内外都有一些不同的声音,一个无法回避的客观现实是:网文的盗版方式太简单了。
在各种内容领域,文字或许是盗版技术成本最低的一种。哪怕是拍照做文字识别,盗版都能流传出去,现有技术可以做到连错别字都几乎没有,没有门槛、成本极低。
更大的困境在于规则层面。
网文盗版被判定的经济损失一般远低于影视、游戏,导致一方面执法热情不高,另一方面维权企业方也因为消耗的人力、时间成本而陷入苦战。年,围绕《鬼吹灯》这一知名IP的盗版,法院判罚了50万,已是当时行业的天花板。
阅文的法务团队多年追打盗版,他们经历了太多由于网站服务器在海外或者使用虚拟服务器,没有ICP备案,找不到侵权方,在茫茫大海里捞针的挫败。他们也有一个“公敌”——笔趣阁,其为国内最知名的盗版网站,在几年前被法务投诉封禁后,笔趣阁宣布开源。这使得任何人,只要愿意(甚至可以在网络上买到全套代码和服务),就可以复制无数个一模一样的笔趣阁。
这就是著名的“笔趣阁宇宙”。
应用市场中五花八门的“笔趣阁”
困难重重,但程武还是想要做这件大事。年,因为盗版受影响的作家就达到6万名,断更作品超万部。阅文内部人士透露,在听到这个汇报之后,程武在总办会上表态,“网络文学是数字文化产业版权治理的最后一战,决不能再麻木下去。”
“阅文要把反盗版推向新高度”,年年底,阅文内部的一些人被同步了这样的信息。
敌人
黄琰是这场战争的指挥官。在年11月的作家年会上,这位刚来阅文的集团副总裁想和作家进行第一次直接交流。没想到,各种针对盗版犀利的质问最先扑面而来。
“阅文对打盗版到底怎么看?到底有没有能力打?有没有信心打?能不能持久打?”《我们生活在南京》的作者天瑞说符提出了灵魂四问。
被口水淹没的黄琰有些尴尬,此刻他刚全面负责阅文产品、技术等业务。在此之前,他只了解阅文去年仅几本重点书就打击了20万条链接,觉得“做得还不错”。直到被作家们质问,他才意识到在反盗版问题上,平台和作者存在认知错位。
对于平台来说,假设有条盗版链接,平台打掉90条,就是很好的成绩。
对于作者来说,只要打开搜索引擎一搜自己的作品,看到还有盗版,就会认为打盗失败。
道理也简单,即便只剩下一条盗版链接,搜索引擎也会把这唯一的盗版链接呈现给读者。
黄琰是中科大计算机专业毕业,做了多年的程序员和产品经理,作者的抱怨,启发他重新拆解未来的战争逻辑。
“我们这次打盗版的衡量标准,并不是计算封杀多少盗版网站,而是增加作品创作的安全感,不用担心自己作品轻易找到盗版”,黄琰告诉界面新闻。
卡劳塞维茨在《战争论》中写道,战争就是政治的延续。从历史上的实践来看,要么夺取重要的地区或资源,所谓“要地必争”;要么不计较一城一地的得失,尽可能消灭敌人的有生力量。
但这场反盗版战争不一样,这场战争要的是一种效果,一种状态。
所以,策略需要进一步拆解。
首先是确定敌人。谁是敌人,谁不是。这是一个至关重要的决策。
答案用内部术语来说,是名为“自动化批量抓取者”的盗版商。他们有组织,有明确商业目的,能在国外买服务器,有技术团队,能够雇人来谩骂、叫阵乃至24小时蹲守……
其次是分析敌人。敌人在哪里出现?他们怎么作战?
一根链条浮现出来,即生产、传播、销售。“谁抓取了内容成为盗版源头?谁在过程中推波助澜成为传播路径?谁在过程中提供了商业变现?”黄琰反问。
然后是战术。
“攻防一体”是本次战争的核心战术策略。这次特别强调主动出击迎战,而不再如以往那样,发现某些作品被盗了以后,再去打击。
最后是兵力配置。
阅文内部成立了一个涵盖产品、技术、法务、内容等部门的联合团队。
产品团队要识别和处理那些疑似为盗版商的“风险账户”;技术团队负责堵住疏漏端口防御爬虫,法务则会对盗版商和盗版内容传播平台发起民事和刑事诉讼;内容编辑则要联动广大的作者和读者,倾听他们的需求并请作家配合……
在搜索引擎搜索《我们生活在南京》后,呈现大量盗版链接
另外,还需要联合“友军”。如果那些外部渠道的盗版没有防住,起点自己的反盗版也就等于白忙活一场——好在这些合作伙伴们也都“苦盗版久已”,对各种需求几乎都给予高度配合。
一场立体化战争的序幕徐徐拉开。
初阵
历史上的许多著名战役,总是以双方的小规模接触开始。
年1月,黄琰想在起点读书App中试探性的小打一下。
这场初阵的主题是“找人”,指“定位风险账号”,找出盗版商。起点读书的日活用户高达数百万,在茫茫人海中找到披着羊皮的狼,听上去如大海捞针。
黄琰让起点读书的产品经理西橙去“找人”。
作为一场测试战,西橙团队选了10本书。给这10本书从零开始搭建了一个防盗系统,基于这套系统,去尝试识别,哪些“用户”在“抓取”这些内容。
并不存在“输入一套代码,一键识别坏人”这样的魔术。西橙没有透露内部的评判标准,但强调需要算法和人工判断互相配合。
疫情中的核酸检测也带来了一些启发。“核酸单人单管的速度慢,但10人1管就可以提升效率。万用户可以拆成10个10万,再不断向下拆分,总能找到哪一管是有问题的。”西橙告诉界面新闻。
编辑们也跟作者一起加入作战。作为最了解自己作品被盗现状的人,作者们提供大量“奇形怪状”的盗版站、盗版链接、QQ群等。通过这些线索,找到盗版,看看可能来自哪些风险账号……
还需要对账号进行分级。哪些用户是低风险,哪些是疑似盗版账号。
相比于过往的“被动防守”,这是一种更主动的“索敌进攻”。
1月13日晚,防盗系统测试上线,由于部分用户被误判为风险账号,于是需要进行“滑块验证”。这个模块一开始做得不好,真实用户登不上去,上线一分钟就有客诉。
尽管有许多手忙脚乱的时刻,初战仍取得了非常大的成功。系统仅上线3天,10本书的均订平均有30%至50%的增长,还有2部作品数据翻番。
第一期测试完成后,西橙和同事们在会议室门口堵住黄琰。看了数据,他震惊了。
作者们反响强烈,都希望自己可以加入测试。因为防盗系统能够直接提升作者的收入,好处即时可见。
捷报不断传来,初战的胜利,也让程武觉得,战争可以进入下一步了。
全面战争
程武给了反盗版团队更多的资源,黄琰的压力又大了。从3月开始,“战争”迅速升级,10本书变成百本量级,难度开始呈指数级增长。
而且所谓“攻防一体”,防与攻同样重要,不断封禁掉盗版商账户的同时,也不能让自己的内容轻易被自动抓取。
盗版商也开始进入状态,他们开始升级自己的技术抓取能力,双方的“先锋”——技术团队开始频繁短兵相接。
“至少25个海外盗版团伙对我们的目录页进行全面扫描,每天至少有60万次试图非法对章节进行获取,而且会不断重试。极端情况时,我们一分钟能收到来自同一IP的次请求。”反盗版团队的技术负责人炜于告诉界面新闻。
同时期,上海疫情进入紧张状态,全市企业居家办公。炜于和团队开始两班倒,他的要求是,“发现攻击,立刻定位对手策略,并在十二小时内上线解决方案”。
在技术、产品团队激烈攻防的同时。一条隐秘战线也随之展开,那就是法务维权。阅文的诉讼维权组全体立下军令状,全部卷入战场。
官司频频开打,但相比于技术,司法维权面临的困境更“自然不可抗”。诉讼过程繁琐、审理周期长,被诉对象还会利用管辖权异议拖延时间。一件案件往往延宕数年。即便一审败诉,被告仍会提起上诉,能多拖一天就是多盗一天,就能多赚一天的钱。
不同于电视上的“精英律师”,这是一份枯燥的工作。法务需要处理大量的诉讼和编辑转来的作家投诉,周而复始,24小时全天待命。
“因为我们只要发现线索,就立刻要进行保全,”唐安说。团队每周要给各种传播盗版内容的平台如金山文档、贴吧等发投诉函。一封投诉函里,常常有他们过去一周整理的数百条侵权链接。
有一个贴吧,简介里明目张胆地写着“《夜的命名术》盗版交流”。唐安表示,“平台虽然不至于拒不配合,但也从不主动监管”。反复耗了两个多月,“盗版交流”的介绍去掉了,贴吧里也基本没有盗版内容了。
贴吧反盗版初见成效
刑诉官司更是要打的。盗版产业链复杂,犯罪团伙的成员往往分布在不同省市,法务要配合警方前往全国各地抓人。上海的同事去不了,就让外地的同事去。抓人的时候,为了不打草惊蛇,全国几个地方的警方需要同时行动,有人提着行李和警察一起蹲在车里等时机。抓完人回到机场,发现自己的行李早不知道丢哪了。
泥泞中的胜利
本质上,这场战争是每天枯燥的日常消耗。胜负往往取决于双方投入资源的多少。炜于也认为,很难有完全没法破解的技术,在乎对方能投入多少资源,多少人力。
还有时间。时间对盗版商也是成本,在开始的时候,一本书从发布到被破解,时间可能是几分钟,慢慢就变成几小时,然后是几天。
炜于发现,当被破解的时间越来越长,盗版商的攻击强度就会降低。隔着网线,似乎都能感到他们在变得沮丧。
如果盗版是黑色产业,那么生意是要算账的。“盗版当然是有利可图的事,但如果你在加州,却要在当地雇很多人干这件事,那么显然就无利可图了。”黄琰表示。
这场战争没有浪漫可言,但有时候会有些“惊喜”出现。在长期和一个洛杉矶的盗版商过招后,反盗版团队决定送给太平洋东边的对手一件“礼物”。这一次,盗版商轻松“攻破”了一本书的防线,他们并不知道,自己抓取的内容只是一份正版介绍——“更多精彩内容,尽在起点读书”。
“用技术来抓取的盗版商不看内容,也不在乎内容。”炜于说。
到4月下旬,双方都开始陷入疲态,战争进入一种泥泞状态。黄琰担心团队要累出问题,启动了预案,把有战斗力的团队轮番送上前线,“保证技术团队打一场仗后会有休整时间,一排打完这仗上二排,二排打完这仗上三排,而对盗版的打击是连绵不断的”。
唐安他们几个月来打掉了数十万条盗版链接,包括一个访问量达到几百万的金山文档。而在与各大应用市场的反复拉扯后,一部分“笔趣阁宇宙”的App已被处理下架,剩下还在运营的也在陆续下架侵权作品。当然,关于他们最想要的——赢个大官司,还在全速推进。
前线“炮火连天”,上面也一刻不放松。程武每两周就要召集整个高管团队了解反盗版行动的进度,经常具体到每一本书数据的变化。
4月26号,反盗版书目再次翻倍。《我们生活在南京》终于加入了。反盗版团队则突然发现,系统性的盗版商在阅文的生态内几乎消失。
这让全体成员陷入一种欣喜,就像第一次世界大战进入到年时,法国或德国的士兵走出西线战壕,突然发现,对面的敌人消失了。
战争当然没有结束。新的变数来了,某个屡战屡败的“黑客”,伪装成“热心读者”在一个论坛上做了一次关于“反阅文反盗版”的技术分析。大概受到了这篇“大作”的不少启发,很多盗版商卷土重来。炜于和团队不得不在抢菜的同时,又一次次去升级防盗的系统。
五一到来,战场又开始进入平静。“他们是不是放假了?”炜于猜想。但是假期结束后,战火并没有大规模重燃。他们真的走了?苦战了一个月的技术团队,此刻面对寂静的战场,感到隐隐的不安和压抑的兴奋。
到5月中旬,一直