4
雷鋒網按:本文作者霍炬,來自公號“歪理邪說”,雷鋒網已獲得授權。

前述起訴杭州麻瓜網絡科技有限公司(公眾號“差評“運營方)疑似抄襲案5月23日在杭州第一次開庭審理結束,當場未能作出判決,審判長宣布擇日開庭再申。需要再次開庭也說明了這個案件有一定復雜性,可見我之前說的沒錯,這是一個有趣的案子。
第一次開庭審理完成,該公開的東西也基本都公開了。我就可以來說說為什么要打這場官司,以及在這場公司里面我們有什么樣的創新了,因為這些創新,它成了一個值得原創作者、媒體人、法律屆和計算機技術行業共同關注的案子。
很多人好奇打這個官司的目的是什么。通常看到索賠標的1塊錢的案子,大家都明白,它的目的一定不是賠償本身。據說被告方項目的投資人在朋友圈破口大罵,說我是炒作。看到這種奇怪的事情只能想到炒作這一個目的,這恐怕是個境界問題。
對于這個案子,我真正的目的是“測試”。這是非常工程師的思路,做為工程師,如果我們發明了一種辦法,一定會實施它,并且在現實中驗證它的可行性。而我需要驗證的這個方法,只能在法庭上驗證,于是就有了本案。
在法庭上,我方律師詢問被告方,在創作被告涉案文章之前,是否閱讀過原告文章(也就是我寫的Telegram那篇文章)。被告表示“沒看過,是之后才看過的”。之后我方律師出示了一份證據,這份證明表明了在原告文章和被告文章中,都出現了兩個短句:
“兼具數學和工程之美”
“最底層的簡單API實現”
這兩個短句看起來很普通,但如果用搜索引擎分別搜索這兩個短句,無論是Google還是百度,都會發現使用過這兩個短句中任何一個的文章都只有兩篇(在本案立案時),分別是我原始的文章和被告的涉案文章,以及各種對這兩篇文章的轉載。公眾號的發表時間可以證明,我的文章在前,他們的文章在后。這充分證明了兩者是有關聯的,并非被告律師所說的“獨立創作”。被告律師在幾分鐘之前在法庭上表示的“沒看過”,也就不成立了。

圖:兩文對比。他們說之前沒看過我的文章顯然是撒謊。
我是如何做到這件事的?這其實就是我想通過本案驗證的東西。我還沒給它正式命名,估計“文字標記”或者“文字信標”之類的名字會比較符合它的含義。
這個辦法的具體做法如下:
在符合中文語法的情況下,通過改變詞語搭配,使用同義詞和形容詞的組合和堆疊,來創造一個歷史上沒被人使用過的短句。
在一篇創作完成的文章中,尋找一些合適的句子,用這樣獨一無二的短句替換它。
間隔一段文字就進行一次這種替換。讓獨一無二的短句在文章中達到一定密度。
具體用本案的證據為例,如果說“底層API實現”,用搜索引擎一搜,可以搜到很多文章用過。于是我變換了這個句子,變成“最底層的簡單API實現”。其中形容詞“最”和形容詞“簡單”都是多余的,但是加上它們之后,就變成了之前沒人用過的句子,并且仍然符合中文語法,也不會破壞本來要表達的意思。于是我們就通過堆疊形容詞,得到了獨一無二的短句“最底層的簡單API實現”。另外一個例子也一樣,如果寫“數學和科學之美”,這就是一個常用的短句,把“科學”換成“工程”,就變成了獨一無二的了。我還可以繼續修改它,比如“精致的數學和工程之美”,或者“精致的數學和復雜的工程之美”...…總之,總是可以通過這種堆疊和替換找到一個合適的短句。
為什么要這樣做?因為知識產權案件中”獨立創作“本身是案件的關鍵因素。我國著名法學家程榮斌先生所著的《知識產權法: 案例?法規?試題》一書中有以下論述:“獨立創作著眼于從創作過程考察作品…指作者獨立于其他作品創作,即在創作過程中沒有抄襲或復制其他作品的行為。”。可見,證明對方有實際直接的抄襲行為就是關鍵。當我做為原始作者把這樣獨一無二的短句放在原文之中,如果抄襲方抄走這樣的短句,放在了他的新文章中。這就是對方抄襲而非“獨立創作“的直接證據。可以很容易證明兩篇文章是有關聯的。從而推翻關于“獨立創作”的辯護,推翻這一點之后,其他的證據組合就可以發揮更大的效果,巧合就不再是簡單的巧合。這兩個短句很小,但它們就像兩根釘子,釘住了對方。
資深媒體人們(比如被告公司)所擅長的“洗稿“手法,也恰好是利用著作權法的這種解釋。他們通常自我辯護“我們是通過一樣的公開材料創作的作品”。雖然是雷同的作品,在司法上不一定能就此認定他們是抄襲。有了我的“文字信標”之后,事情恐怕就會有一些改變了。
以上解釋有一點羅嗦,用一個不太恰當的類比,它就像你知道別人要抄你的試卷,于是你故意在卷子里面寫幾個錯字,等著對方連同錯字一起抄走。 微信的原創保護是一種被動防御手段,我這個辦法算是主動防御。
被告方顯然是熟練應用洗稿這門藝術,除了我之外,還有不少原創作者跟我吐槽過被他們通過用洗稿的辦法抄襲。在微信的體系里面,這種辦法確實可以逃過微信原創系統的檢測,但想逃過我這個標記難度就大了很多。的確,我們永遠不可能斷絕抄襲行為, 別說寫文章,就算學術論文的抄襲檢測已經嚴格到今天這種地步后果又非常嚴重,每年仍然有大量的人以身試法,更別說寫一篇文章了。不過我們仍然可以通過一些辦法,大大增加抄襲成本。微信的原創保護是通過技術方法前進了一大步,我這種辦法也是一樣,同樣是使用技術方法把這件事往前推動一步,增加抄襲成本,雙方的斗爭會一直持續下去。
為什么會想出這個辦法?我多年從事搜索引擎相關工作,基本就是跟文字、分詞、文本相似、文字指紋、ranking這些東西打交道。這是一脈相承的技術思路,既然我們可以判斷文本相似性完成搜索,一樣可以通過搭配來創造唯一的句子。創建這種獨一無二的句子通過“程序+人工”的方式,成本是很低的。但對于抄襲方,找出來這些句子成本就高了很多。因為它完全符合語法,只改動搭配和形容詞,語法檢測也很難找到它們(何況中文本來就是弱語法的,我們每天都在創造無數的病句)。如果通過此案證明了這種方法可以被法院認可,那么就可以推廣它,從而為原創作者和知識產權領域做一點點貢獻。
這也是一個很好的法律和計算機技術跨界合作的案例。非常感謝我的律師嚴飛先生,他非常專業,我第一次給他講解這個方法的時候,他立刻就明白了,當即問我:“是不是就像程序員會在代碼里面故意加一些無用的錯誤代碼,以證明代碼是自己寫的”。非常準確,程序員們使用這個技巧已經有幾十年的歷史了,我們一直通過在代碼中植入特殊的跳轉、特殊的數字之類的東西來創造代碼的唯一性,并做為簽名,在軟件方面的知識產權訴訟中,出現過這種案例,但應用到文字創作上,我覺得這應該是第一個公開的案例。


圖:Google和百度搜索結果(注意搜索時候加引號)。非常壯觀,綠色的是我的原文,紅色的是被告文。今天搜索結果頁面已經和當初取證時候不一樣了,又多了關于此案的報道,并且還順便抓到了另外一個洗稿的(時間仍然在被告之后),但要證明的事情還是很明顯。這個結果也顯示了,用這種辦法輕松找到所有的轉載,很方便。
嚴飛律師還準備了另外幾份證據,包括兩篇文章所選取的資料完全幾乎一致,他把文章分解成19個片段,每個片段對應一個事件,兩篇文章在拆分之后,在19處中有18處是重合的。另外還有關于敘述方式對比文章中描述事件的時間線,兩篇文章使用正敘,倒敘,插敘的順序完全一致。再加上前面這兩個短句證明了對方直接抄襲。是一組很不錯的證據。
庭審過程中還有一些亮點,比如被告方律師在前面一個多小時的時間里始終力圖證明“霍炬不是霍炬”,即委托人霍炬不一定是公眾帳號文章的署名者“霍炬”,以試圖直接推翻案件。這是利用了微信不給個人帳號做認證的漏洞,雖然我是拿身份證實名注冊的公眾號,但是微信沒有一個界面可以提供這種身份查詢。不過本案法官相當機智,當場讓我方律師詢問我的公眾號用戶名密碼,法官在法院計算機上親自登錄公眾帳號,查找歷史文章,找到了我發表過那篇Telegram文章。之后被告方律師仍然試圖推翻這種聯系,法官則表示“法庭已經查明...…[法官陳述了登錄和查找文章過程]…...可以認定霍炬即是原告文章作者”。如果以后還有人想進行類似的訴訟,要記住證明這一點。其實就算是我本人親自出庭,對方律師還是會利用這個漏洞的,恐怕還是要當場走一遍這個流程才能證明。也許在準備證據的時候請公證處公證一下公眾號登錄和查找過程更為簡單?微信也許將來也能為我們這些未認證帳號提供一個更直接的證明方式,畢竟是拿身份證注冊的,微信在系統中提供一下關聯關系并不困難。雖然理論上可以委托法院到騰訊公司調取證據,但這無形中增加了法院的司法成本,沒什么必要,還是能自己解決最好。
最后法官問我方律師:“嚴飛,你怎么找到這種案子的?” 律師回答“因為有趣…...”
是的,我說了好幾次,這是一個非常有趣的案子。我等這個案子已經等了很久,從我開這個公眾號的第一天,就在使用這種辦法為我的文章植入獨一無二的“文字信標”。當然,這么做并不僅僅是為了訴訟,它還能幫助我尋找文章擴散的范圍,我只要去搜索引擎上搜這些短句,就能找到所有轉載我文章的地方,不會有冗余信息干擾。這樣我可以很容易去各論壇閱讀我文章被轉載后的評論。很多朋友之前也好奇過,為什么我總能找到轉載我文章的地方,無論多小多隱蔽都能找到,這就是我的秘密武器。
但在司法上到底如何認定,靠我自己臆測和推斷是不行的,必須要經過一次審判過程才能驗證它。但偏偏這個時代人們都比較喜歡大事化小、小事化了,好幾次我公開指責抄襲我文章的人,對方都是立刻道歉或者找中間人幫助和解,遇到這種情況,我也不好板著臉追下去。直到等到了這位資深媒體人徐建軍先生(此處直接寫出姓名未侵犯徐先生權利,因為這是從杭州工商信息公開查詢到信息)、以及后來變更之后的新法人代表陶偉華先生(此處直接寫出姓名未侵犯陶先生權利,因為他是此案被告法定代表人)。他們拒不承認抄襲行為存在,甚至還在差評公眾號上寫了一篇文章指責我碰瓷。想必是他們熟知媒體運作,也知道這種訴訟成本很高、難度很大,有恃無恐。但他們并不知道技術上可以有這樣的思路,也不知道已經吃了我埋的餌。他們曾經認為我是“裝大度,裝不生氣”,相信現在他們明白了,我不僅不生氣,還很高興,甚至可以用狂喜來形容,因為終于有人配合我做這個測試了。衷心感謝二位的配合,不然我還得繼續等待下去。
亦有其他做媒體的朋友告訴我“傳統媒體人對這些事情看的比較輕,不覺得這樣算錯誤“。這我也能理解,畢竟中文創作市場已經不規范了那么多年,如果沒有微信的原創保護,今天個人創作者仍然是極度弱勢。不過,因為技術的加入,事情逐漸開始變的不一樣了。我在《無限只猴子》那篇文章中提到過 “微信團隊做為媒體行業的外行人努力維護這個行業,但同時內行人們用自己的知識和技巧從內部繼續挖垮它”。今天我要改一下這句話,應該說“盡管如此,更多的工程師、另外一些媒體人以及法律人們,正在一起維護這個行業,并且改變它”。
至于本案結果,它反而不那么重要。如果最終結果證明這個辦法有效,我會推廣它。如果無效,我會繼續尋求法律人士的幫助,完善它,然后再試一次。我并不是一個狂熱的知識產權擁護者,我創造了大量采用MIT/BSD這種寬松許可證的東西,但是對于目前這種完全不尊重原作者的“行業慣例”,還是希望能做點事情改變它。
順便說一句,工程師們正在改變很多東西。無論是前一段“魏則西事件”之后,工程師們在GitHub上建立的“醫院開放數據“項目還是本案,工程師們使用的工具、方法論和思路,都已經突破了虛擬世界的邊界,開始影響現實世界。工程師們在虛擬世界中面對的問題相當復雜,于是發了了各種工具和方法論,當這些東西開始用來解決現實世界的問題時,就會產生一些前所未有的效果。在這個過程中,需要各種其他專業人士一起努力才能有比較好的效果。未來這樣的事情還會更多,一起期待吧。
最后,再次感謝快版權、浙江秉格律師事務所,感謝嚴飛律師和他專業的團隊,感謝當初為了此案聯系我的Vivian Huang,感謝去庭審現場圍觀,幫我轉述庭審過程的“追風箏的人”。我在之前“快播案”的文章中提到過,我是一個業余法律愛好者,是各位的幫助,讓我這個業余法律愛好者的胡思亂想,終于走到了被檢驗的這一步。謝謝你們!
“喵雷格喵”寫了一篇文章,更詳細的記錄了庭審過程。更關心細節的朋友,可以去讀她的文章:《“新版瓊瑤于正案”:霍炬訴“差評”抄襲案正式開庭》
參考備注:
標題圖:在deck頂上跳躍的推特,西喬拍攝。推特是本公眾號頭像中的這只貓,出生于上海張江。推特是極好的獵手,為了捉一只老鼠能趴在一處十多個小時一動不動,直到最后跳起捕獵。
前情提要:不需要無限只猴子的創新抄襲 這篇文章講述了我如何找到被告的真實身份
原始文章:Telegram傳奇:俄羅斯富豪、黑客高手、極權和陰謀…...
做為法律愛好者,我寫的快播案文章:快播案:程序正義、盜版和色情
雷鋒網注:轉載請聯系作者并注明出處,不得刪減、修改內容。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。