2014年6月18日

發現被盜文時, 如何保護著作權及反制?

A+

(Pic from: ewp.rpi.edu)
談到盜文這件事,相信都是群情憤慨,就如同「網站被 7headlines 框架」事件一樣,誰都不喜歡著作權被消費或竊取。

網路上的盜文應該可分成兩個層次,一種是完整的複製貼上,另一種是內容重整(部份心得、部份複製)。不曉得讀者覺得哪一種比較無法忍受呢?

以 WFU 而言,若被盜文的話,比較討厭的是內容重整那一種。以下會敘述理由,及各種自保與反制的方法。



一、層次1: 複製貼上


1. 自保技巧

過去曾寫過一系列「保護著作權」的文章,如果使用了以下的技巧:

  • 文章內多使用自己文章的連結
  • 文章某些用到 "我" 的時機,替換為 "WFU"
  • 使用隱藏字串

相信這樣的文章,就算被複製貼上,讀者還是能夠知道該篇文章真正的出處為何。

如果想了解其他的自保技巧,可參考「如何用語法保護網頁文章著作權__(二)阻止全文轉載」系列文。


2. 複製貼上的動機

有的人複製貼上是真的在盜文,只是他不知道這是比較容易被抓到的途徑。不過或許有的人複製貼上,只是為了備份的目的,放在自己的部落格方便將來查詢。

例如本站這篇「讓 Google 試算表能自動回信__FormEmailer 設定」,發現「這篇複製內容」的圖文一字不差。反正連圖片浮水印都看得出來源為何,WFU 乾脆睜一隻眼閉一隻眼,省下追訴的時間與力氣。


3. 保留追訴的權力

雖然上述例子 WFU 尚未追究,但不代表複製貼上是可取的行為,因為根據本站下方宣告的 "CC 條款"(以及導覽列的 "版權聲明"),轉貼是需要 "姓名標示" 及附上出處連結的,因此視情況 WFU 有可能追究,萬一該篇盜文的搜尋結果很前面的話。

而且這還是比較寬鬆的 CC 條款,另一派主張使用「著作權」的站長,可用更嚴格的條件對付轉貼者,請參考 +Almighty Demiurge 這個「Blogger中文社群討論串



二、Google 能否判定重複內容?


雖說 WFU 比較不擔心文章被完整地複製貼上,但這是因為本站文章偏 "資訊類型",利於使用前述的「自保技巧」來保護文章。如果是其他旅遊、美食、攝影類的文章,也許不是完全適用。

而且,還有一個嚴重的問題,Google 搜尋引擎怎麼知道是 WFU 複製別人的文章,還是別人複製我們的文章?


1. 原創性標記 Google Authorship

因此,取得一篇文章的「作者認證」是極為重要的事情,當 Google 認定你是該篇文章的原創作者後,文章的搜尋結果會出現大頭照,而其他一樣的複製內容當然就是抄襲啦,會很難出現在 google 搜尋引擎。

2014.7.15 更新:現在 Google 搜尋結果已經取消作者的大頭照,但「作者認證」仍然存在,詳細說明請見搜尋結果不再顯示作者頭像!Google 為何要這麼做?

申請原創文章標記的 Google Authorship,可參考這系列的流程「讓作者頭像出現在搜尋結果__申請Google Authorship心得」。


2. 仰賴第三方社群媒介

沒有申請原創性標記怎麼辦?Google 會怎麼判別重複的網頁呢?如果是規模較小的草創網站,這一點的確比較麻煩,因為 Google 收錄的速度慢,說不定盜文者的網頁還比原創者搶先收錄。

這篇「Stolen Content問題,文章被盜用怎麼辦?」提出的作法可供參考,發文後請第一時間分享到社群媒介(Google+ 或 Facebook),因為:
  • 部落格發文時間能夠竄改
  • 社群網站貼文時間無法變更為更早的時間

因此藉由第三方社群網站,可以輔助判斷誰才是原創者。


3. 自動同步貼文

要如何實現第一時間貼文到社群網站?以 Blogger 為例,可以這麼做:

  • 同步到 G+:Blogger 後台 → Google+ → 張貼文章後自動分享
  • 同步到 FB:使用 IFTTT → 設定 recipe → Blogger 同步到 FB

若 IFTTT 不清楚怎麼操作的話,可參考 +Phil Ko 這篇「Blogger發文自動分享到Facebook



三、層次2: 內容重整


內容重整是 WFU 比較頭痛的抄襲方式,因為此類盜文者願意花時間把隱藏字串去除、把連結及特定字串去除,一部份內容保持一樣,一部份內容改用自己的話說。

講白了他們就是要偷我們的構想,但不想給我們 Credit,又要裝成自己是原創。其實,這一類的剽竊者很多,不只存在於網路上,網路外的實體書籍很多都是這麼做,+Pan Kuan 在 Blogger 中文社群提供了「這個案例」可供參考。

對於「內容重整」式的剽竊作者,不容易抓到,但只能說,不是不報、時候未到。就像論文抄襲沒有標示出處,多年之後被抓包時,爬的位置越高,屆時只是摔得越重。(論文被踢爆涉抄襲 6日部長 楊念祖閃辭涉論文詐審醜聞 蔣偉寧下台)



四、處置盜文的流程


當發現盜文者後,如何處置也許要依照情節輕重而定,以下整理一些可當成 SOP 的流程作為參考:

1. 走法律途徑

如果認為符合以下條件:
  • 權益受損很大
  • 需要走求償路線
  • 有時間
  • 有經費

那麼可參考這篇「被盜圖盜文侵害智慧財產權怎麼辦?有免費法律諮詢嗎?」,步驟列的滿詳細的,留言也有一些求償成功的案例。


2. 網路處理 SOP

如果屬於寫文章都來不及,沒有美國時間跟對方耗的站長,那麼可以在網路上直接將抄襲事件處理掉,可參考上一篇「處理盜文簡易 SOP 流程」,以下只摘要重點:
  • 保存證據:避免對方網頁可隨時更改。
  • 向搜尋引擎檢舉:使抄襲文章無法出現在搜尋結果。
  • 向發文平台檢舉:向部落格平台、論壇檢舉,讓文章下架。
  • 向主機商或域名商檢舉:成功的話,這個網域就被拔除了。


3. 是否需要知會抄襲者?

會不會覺得網路 SOP 有點少?許多站長還會好心地去函對方,請求將抄襲圖文下架。WFU 認為,對方抄襲前也沒想過要知會我們,而寫文章的時間都不夠了,實在沒多餘時間跟一位抄襲者魚雁往返!

當然,凡事都有例外,如果讀者在抄襲者的網站,看到作者的大頭貼是位大眼無辜美少女(男),那麼合理的推斷應該是這位妹妹(弟弟)涉世未深,不清楚要善盡先行知會才能轉貼的義務,才會不小心犯了這個錯,因此去個函 "溝通" 一下是非常合理的。

如果不是以上情境的話,建議省下這個時間,直接向 Google 及發文平台開鍘吧



五、Blogger 平台檢舉流程實例


關於檢舉的實例,盜文平台在 Blogger 的話可參考這篇「Blogger 檢舉盜文流程」,若在其他平台請 Google 一下聯繫的窗口了。

需要特別提的一點為,在實務的操作上,如果希望盜文者的網站能被搜尋引擎處罰,降低該網站的信任度及權重,那麼建議先跟搜尋引擎檢舉,等搜尋引擎處理完後,再向盜文平台進行檢舉。

WFU 之前就是 "發文平台與搜尋引擎同時提出檢舉",結果發生 Blogger 平台先將文章下架,之後 Google 搜尋引擎要處理檢舉案子時,卻找不到盜文網頁這樣的結果。



六、如何知道被盜文?


如果是英語系的文章,國外有提供監測盜文的服務。然而,Unicode 系(含中文)的文章,目前要能偵測出盜文,只能我們作者自己 "勤奮" 一點、或是有報馬仔幫忙回報,才有可能得知。以下提供一些方法供參考:

1. 這篇「揪出抄襲者的幾個方法」 提供的方法有:
  • 以圖搜圖
  • 用 Google Alert 訂閱文章標題
  • 文章剽竊檢測工具 Turnitin → 須自行上傳文章才能幫忙偵測


2. +Pan Kuan 在這個「Blogger中文社群討論串」使用的方法為,在文末插入個人常用語,定期用 google 搜尋此常用語,藉此發現是否有盜文者。


3. WFU 個人常用的作法為,利用「histats」→ Referring Sites 功能──



除了可看看讀者從哪些網站連過來,偶爾不小心就是靠這個功能抓到盜文者!更多使用技巧請參考「Histats 計數器操作心得」。



七、小結


雖說以上提供了不少抓盜文者的方法,然而都是必須 "勤勞"、"持之以恆",才能長久見效;只要一偷懶,必定讓僥倖者得利。

WFU 在想,如果能有個簡單、操作方便的方法,可 "自動" 揪出盜文者,那就再好不過。下一篇將會提出這個構想,希望能遏制短視近利的剽竊心態。


處理盜文相關文章:

沒有留言:

↑TOP

張貼留言注意事項:

◎ 勾選「通知我」可收到後續回覆的mail!
提問請附網址、詳細描述狀況,如提供的資訊不足,則無法回覆。
◎ 請在相關文章留言,與文章無關的主題請至「Blogger 中文論壇」。
◎ 若詢問 CSS 、非官方範本問題、或貴站為商業網站 ,請參考「本站諮詢頁面」→「1. 諮詢服務」
◎ 若留言要輸入語法,"<"、">"這兩個符號請用其他符號代替,否則語法會消失!
◎ 若發現留言不見了,通常是因為 "複製貼上" 的內容常被系統判定為垃圾留言,請不用擔心,我會定期將留言恢復。
◎ 本站「已關閉自刪留言功能」。