國家首次提出打擊洗稿!洗稿之痛,到底痛在哪里?
作者:張潔,首發:新榜
7月16日,國家版權局、互信辦、工信部、公安部等四部門宣布聯合啟動 “劍網2018”專項行動。這個行動旨在打擊網絡侵權盜版,自2010年開展至今已是第9年。
值得關注的是,新媒體的“洗稿”問題在今年被首次提及,換言之,這是國家有關部門第一次提出打擊洗稿。相關違規賬號或面臨新一輪嚴查,甚至關閉。
此次行動將整治自媒體通過“洗稿”方式抄襲剽竊、篡改刪減原創作品的侵權行為,并規范搜索引擎、瀏覽器、應用商店、微博、微信等涉及的網絡轉載行為。
雖然其中并無提及更多細則,但仍不失為一個重要信號。消息一出,也再次引發部分從業者關于洗稿的討論,以及對于背后一系列問題的思考。
洗稿這個詞,新媒體人應該都不陌生了。
在內容創業時代,每個創作者都明白原創的艱辛,所以沒有一個詞可以像“洗稿”那樣讓我們深惡痛絕。畢竟,原文照搬的抄襲都是肉眼可見的鐵錘,洗稿卻能把你的東西改得親媽都認不出但又讓你覺得明明就是你的。
這是一種什么感覺呢,知名自媒體人魏武揮曾用“吃了蒼蠅”來形容被洗稿的感覺。
此前,“和毛利午餐”因洗稿糾紛在公號上大戰幾個回合后,甚至以洗稿為題寫起了連載小說,雖注明純屬虛構,但可見胸中憤懣。
從霍炬差評對簿公堂、六神磊磊手撕周沖、櫻桃畫報致信閃送、格十三發文指被眾多賬號洗稿至今……談及洗稿,能被人很快記起的,往往至少有一方是頭部大號。這些案例相較不為人所知的那些,還只是滄海一粟。
但目前,無論是法律、技術、平臺亦或行業規范,似乎都很難解決這個問題。大多數情況下,原創者只能在家氣到跺腳,破口開罵。不過問題仍然存在,而且是整個行業的痛點。
如何界定洗稿,如何推動解決洗稿難題,這背后有哪些錯綜復雜的阻礙?借著今天新推出的整治消息,我們嘗試重新對這個話題做了一些梳理和探討。或許不會起到更多幫助,但希望能拋磚引玉。
01
是為人類知識更新做貢獻,還是剽竊?
洗稿并不是法律上的概念,而是傳媒行業特有的名詞。
關于洗稿的定義,國內傳媒法專家魏永征教授曾在文章中介紹過,“洗稿”一詞出于香港新聞界,當時指的是某個新聞事件,沒有到場采訪的記者從廣播電視或網上的報道獲取信息,撰文發表,或同行間分頭采訪后對事實交換共享,基本都不涉及版權問題。
但今天所說的洗稿,語義已經發生了變化。簡單說就是,通過調整變換一篇原創文章的段落、字詞、語序等,將其“清洗”成看似全新的內容,但實際上是變相的抄襲和剽竊,即“實質性相似”。
“半信半疑”改成“將信將疑”,“張三李四”改成“張四李三”,將文字轉化成圖表,圖表改成文字,更有甚者,將一段話拆分成幾段,或將幾段話拼成一段,一篇文章拆成幾篇,幾篇湊成一篇。花樣層出不窮。
有網友這樣形容被洗之后的文章,由于很多洗稿都在替換同義詞,導致最后“文章呈現出一種迷之外國人寫中文作文的感覺,讓原作者石化在電腦前,不想追討,恨不得撇清跟這段奇文的關系”。
洗稿也不是什么新媒體的產物,在傳統媒體時代或者更早,可以說有原創的地方就有洗稿,只不過呈現形式與帶來的影響有些差別。總的來說,關于洗稿的定義并沒有標準答案,但有一個大致的行業約定俗成的印象。
比如刺猬公社創始人葉鐵橋認為,關鍵在于文字中是否包含了獨特的勞動成果,如果是,應當注明源頭以示尊重,“為了逃避被認出來,而在原稿基礎上做改頭換面和整容,就是洗稿”。
圍繞洗稿,有一些比較常見的關鍵詞:搬運,替換,拼貼,整合,思想抄襲。
隨著資本的進駐,內容早已不僅是簡單的個人表達,圍繞流量、變現等一系列規則,創業者以內容為匙,建立起一個個商業工廠,不同類別的內容就像不同口味的面包,可以被批量制造。
原創者日復一日守著鍵盤碼字總是苦兮兮的,而且單兵作戰耗時長,運營推廣能力弱,搬運黨洗洗抄抄加個標題黨,反而可能在短時間內以低成本的方式獲得高流量。
除此之外還有一些其他因素在推動,比如用戶其實不在意,或者說無法察覺文章內容是否洗稿。
再如知名自媒體人魏武揮曾提到,有些洗稿是為了應對百度新聞合并同類項的呈現規則,改成不太一樣的文字以便獲得更多點擊。
在流量與資本的種種誘惑下,自媒體時代的洗稿大軍橫空出世,而且已成體系。
不少新聞媒體包括新媒體都研究過這背后的做號江湖,新榜也曾暗訪洗稿的灰色產業鏈,得知洗稿者有人千字10元,也有人月入過萬。
整個洗稿市場要比我們想象的成熟得多。其中有買賣雙方,有人做中間生意,也有各種洗稿工具、原創檢測工具和偽原創教學等等,還有不少傳授洗稿技巧的文章和課程,美其名曰“間接為人類知識更新做出貢獻”。
讓原創者深惡痛絕的洗稿,對這條洗稿產業鏈上的從業者來說,這只是一項普通的工作而已。
02
“每天跟洗稿的撕逼都快讓我爆血管了!”
即便再多人對洗稿者窮追猛打,目前要解決洗稿問題仍然有很多障礙。
現實誘惑的層面上文已經提到,其他比如洗稿的量大,我們所知的洗稿案例可能不過是九牛一毛。大號洗小號,文章刷屏被發現的概率更高,小號尚可發文鞭撻;小號洗大號,大號可能根本就無從發覺。
由此還帶來社交網絡上熱點事件的偽盛況。新榜曾做過大量熱點話題的數據稿件,幾乎每次采集數據時都發現同一個話題,往往有很多標題和素材相同或相似的文章。
我們不排除其中有爆文帶來的大量轉載,但其中也不乏一些賬號為蹭熱點粗暴洗稿,于是我們能看到同一套素材,換著花樣在不同的賬號反復出現,仿佛大家用的是同一個素材庫。
洗稿的方式和花樣之多,又讓整個問題變得更為復雜。自媒體之間洗的,新媒體與傳統媒體之間洗的,還有自己洗自己的,比如矩陣號之間互相洗稿,一稿多用,外人很難對此判責。
還有跨平臺洗稿的,幾個內容平臺洗來洗去,這也是維權難度最大的一類。
烏鴉電影創始人烏鴉就聊到這方面的困惑,他提到,目前微信公眾號平臺內的洗稿由于有原創標簽保護還不算太嚴重,“更嚴重的是跨平臺的抄襲和洗稿,其維權成本之高,需要提供的證據之多,流程之復雜,這都讓原創者失去了維權的動力”。
這逼得一些自媒體人不得不多平臺分發,稍晚一步,在其他平臺可能連原創都標不了。
還有一些連原創都不必標的平臺。比如自媒體人搖鈴鐺說,她的公眾號文章被一個微博賬號連續抄襲了三年,她每次看到都上去私信罵,對方雖然也道歉,但來年照抄不誤。
“每天跟抄襲洗稿的人撕逼都快讓我爆血管了!”提及抄襲和洗稿,搖鈴鐺整個人都處在一種暴走狀態。
這也是推動解決洗稿問題的另一道坎,很多自媒體人并沒有精力去處理洗稿。即便不走法律程序只是撰文撕逼(走法律程序就更不用說了),作者都需要搜集提供大量證據,一戰就是幾個回合。
“這他媽太累了,連六神磊磊都說懟人一次累三天,不是每個原創者都受得了這種折騰。”烏鴉感慨說。
除了舉證難,成本高也是個問題,或者說付出與回報不一定成正比。霍炬當時索賠1塊錢,明確說目的不在賠償而是“測試”。也就是說,不是所有的賬號都會選擇用曝光等方式爭取權益,此前就有被洗稿的小號通過協商讓大號置換資源導流,作為補償。
還有一個問題恐怕來自平臺。此前,新榜曾發文《沒有自媒體平臺縱容默許,哪來的抄襲拼湊做號江湖?》,提到自媒體平臺之間由于相互競爭和相對封閉,以及部分平臺圍繞補貼政策的內部腐敗,諸如此類的問題,帶來一系列破壞原創的惡果。
此外,有業內人士透露,一些平臺會依據自身對內容數量的需求和外界環境的變化,來調整平臺對抄襲、洗稿等劣質內容的判定規則和技術方案——當平臺需要海量內容時,便對抄襲洗稿睜一只眼閉一只眼、放任和縱容;當外界環境發生變化時(包括主管部門監管或競爭對手起訴等),它們就會動用技術手段干掉那些抄襲洗稿而來的內容和賬號(尤其是明顯抄襲的內容)。
不過,最麻煩的還是洗稿的界定。
雖然上文也提到洗稿的定義,但在實際案例中,如何判定洗稿仍然是最大的難題,無論對平臺還是法官(退一步講,即便平臺有足夠的人力進行人工審核,恐怕也很難斷)。
正如魏武揮所說,洗稿這種事情,感覺為主,“就是讓看過原稿的讀者,再讀此稿,會有一種強烈的‘咦,我好像哪里看過’這種感覺”。
但主觀感覺是很難講清楚的。搖鈴鐺認為,“拙劣一點的洗稿還是很容易看出來的,更難界定的是把你文章的中心思想吸收了再用不同的例子和方式去表達”。
關鍵在于,能否判定是否構成了實質性相似,引起相關受眾混淆,否則最多只能算“同題作文”。
其實也好理解,從法律的角度來說,假如認定范圍過寬,反而會損害憲法保護的創作自由。但究竟是抄襲還是同題作文,這中間的度如何把握,目前還沒有人能給出一個標準。
03
洗稿維權,需要更多的霍矩,還是區塊鏈、哈希?
約束洗稿,顯然不能純靠一張臉皮。如何解決洗稿,其中一個核心問題正是上文提到的“洗稿的界定”,一直以來很多業內人士都在參與探討:
1. 建立反洗稿聯盟,制定行業公約
魏武揮之前在文章中就提到這個設想,建立一種反洗稿聯盟、行會、公約這樣的非盈利組織,由具備聲望的媒體發起,制定一些洗稿的認定方式,然后公益性地聘請一些專家從業者來裁定。
但方案真要實行起來恐怕很難。自媒體人灰鴿認為,類似這樣的組織成立后無非是吆喝幾句,作用有限,“斷人財路這事兒,維權成本極高,如果不是頭部作者,被洗稿后有大家幫忙吆喝吆喝曝光一下已經很不容易了。”
2. 平臺機制的優化
“羅超頻道”認為,微信上的洗稿行為,通過二次申訴+人工審核,就可以清理掉大部分。“二次申訴應該不由機器審核,而是人工審核。如果人工審核之后還是認為沒有抄襲,再給一次復議機會,換一個人審。”
增設人工審核的期待是好的,也不失為一種方法,但個人認為作用不大。一來騰訊不見得會增設如此多人力來做這件事,二來微信目前對洗稿同樣沒有判定標準,僅憑審核人員判斷,恐怕會引來更多糾紛。
當然,這其中也有對平臺作為的期待。此前,有業內人士認為微信的原創體系反而帶來了更嚴重的洗稿。由于原創標后不開白無法直接轉載,導致一些賬號選擇用洗稿的方式搬運。但由于微信目前在技術上無法辨別洗稿,反而給一些洗稿文打上了原創標。
事實上,微信也一直在強化原創的價值,不論是對違規抄襲的打壓,作者體系的建立,還是對轉載模式的探索。從平臺的層面來說,應該更有機會通過機制和功能的調整,例如公號違規機制、打賞功能、流量主分成等作為監督和獎勵的手段,創建更適合當下互聯網語境的知識共享生態,通過優化內容創作分享的模式改善洗稿。
3. 技術的可能性
“傳媒茶話會”曾發文提到,上海治宬網絡科技創始人傅耀稱,現在絕大多數公司都是依靠技術直接對比文章中字詞的相似度,因此拿洗稿無可奈何,但只要改變技術路徑,用語義分析便可解決洗稿檢測的難題。
不過傅耀也提到,開發成本是個問題,目前尚無單家媒體做定制開發。但至少,提供了一種思路。
浙江大邦律師事務所律師熊磊之還提到引入區塊鏈,比如將某個內容備案,將來引入各種機制,給有爭議的內容打分,“打分的結果對人工智能來說也是機器學習的素材,這種例子多了作為人的認知什么情況下是洗稿,系統會越來越準”。
4. 留下文字標記,作為證據
對于推動解決洗稿問題,目前在法律層面值得參考的案例主要是霍炬案和于正案。
當時,霍炬案的結果是證據不足,駁回訴訟請求。霍炬一開始就在公眾號里寫,從開公眾號的第一天起他就在文章里使用“文字標記”(一些獨一無二的短句或詞),其中一個原因就是為了應對將來可能發生的洗稿和抄襲。
霍炬說自己等這個案子已經等了很久,甚至用“狂喜”來形容自己的心情,他為這一戰做了充分的準備,充分到讓人感到有些悲哀——洗稿對對創作者的傷害之深,對這個行業的影響之大,竟然到了需要一個作者長年累月全副武裝,在自己的文字里精打細算地埋雷的地步。
但他確實身體力行,找到了自己認為有效的方式,也就是“文字標記”。
通過獨創一些全網無人搜索的短句短詞,無形中在作者的文章中打上鐵板釘釘的標簽,而洗稿者很有可能無意中搬運,掉進文字陷阱。
5. 內容拆分,細節比對
洗稿不是抄襲,僅做字面上的查重是沒有意義的,要對比就要將內容拆分做更細節的對比。
“架構師之路”提過一個方法是局部敏感哈希LSH(Locality Sensitive Hash):用相同的規則抽取集合中的少部分元素代表整個集合,如果少部分元素的重合度很高,非常可能整個集合的重復度也很高。也就是說,將一篇文章通過分詞轉化為集合來表示,然后在與其他文章的集合進行相似度對比(除了分詞還可以考慮詞頻,以及詞的權重)。
于正案在這方面也能帶來一些思考。雖然是影視作品著作權方面的案例,但案件本質與自媒體的洗稿十分接近。
當時法庭考慮對比的因素包括臺詞、旁白、人物設置、人物關系、具體情節的邏輯編排、語法表達、邏輯關系、歷史史實等錯誤、特殊的細節設計等等。
由于著作權的核心是保護表達而不保護思想,在表達并非完全相同的基礎上,通過拆分細節在不同層面進行對比,能更深入地了解兩部作品是否真正存在抄襲,或者說洗稿。
對自媒體來說,可以參考的細節比如有:文章創意、結構、主要情節、行文順序、引用案例、主要觀點、因果關系推導、人物關系、獨特短句/用詞、文章失誤等。
如果能從這些細節出發一一比對,無論是發文控訴還是走法律途徑,成功率都要高得多。尤其是一些文中特有的細節(比如特殊用詞和失誤),或許能作為洗稿實錘。
6. 個性寫作
除此之外,霍炬還提過兩個建議,一個是不要寫基于信息的文章,“這樣的文章最容易被洗稿,我只寫帶有強烈個人烙印,帶有強烈感情和個人觀點的文章,這種很難洗”。
這個建議確實有一定道理,不過可能也有例外,如果一個人真的想洗你的稿,變著花樣都能給洗了。
7. 起訴
另一個建議是起訴。
“無論結果如何,去起訴吧,去測試可能性,去尋找機會,去幫助司法部門積累案例,無論怎么說都是由意義的”。用霍炬的話說,這就像釘了一根釘子,不致命,但硌手。
熊磊之也談到,雖然全交給司法并不現實,但路徑還是有的,“不過先需要多幾個霍炬,畢竟司法總是被動的”。
我們常說,內容為王,這是內容創作者最好的時代,這句話究竟意味著什么。
某種程度上來說,內容創業能迅速崛起至今,是因為包容了各種不同生態的內容生產方式,讓知識流通和共享的方式發生了翻天覆地的變化。
在此基礎上,創作者確實有了最好的自我表達的陣地,甚至可以此為生,但在流量游戲背后,原創者是否也面臨“劣幣驅逐良幣”的風險?
洗稿確實是個復雜的命題,但并非無解。重要的是,洗稿者不能永遠肆無忌憚,也不會一直有利可圖。誰也無法預知那根釘子什么時候會出現,不是所有的釘子都只硌手,關鍵的部位,再小的釘子也可能致命。
數英用戶原創,轉載請遵守規范
作者公眾號:新榜(ID:newrankcn)
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
全部評論(1條)