Featured image of post Cloudflare 推出更強大工具,一鍵封鎖 AI 機器人掠奪網站內容

Cloudflare 推出更強大工具,一鍵封鎖 AI 機器人掠奪網站內容

隨著生成式 AI 熱潮席捲全球,OpenAI、Google 等 AI 業者的網頁機器人(bot)在未經許可的情況下,大量抓取網路內容以訓練 AI 模型的行為,引發越來越多的爭議和法律訴訟。為協助網站維護自身權益,Cloudflare 近日宣布推出更強大的 AI 機器人封鎖工具,讓網站管理員能有效阻止 AI 爬蟲程式掠奪網站內容。

隨著生成式 AI 熱潮席捲全球,OpenAI、Google 等 AI 業者的網頁機器人(bot)在未經許可的情況下,大量抓取網路內容以訓練 AI 模型的行為,引發越來越多的爭議和法律訴訟。為協助網站維護自身權益,Cloudflare 近日宣布對所有方案用戶(免費方案也可使用),推出更強大的 AI 機器人封鎖工具,讓網站管理員能有效阻止 AI 爬蟲程式掠奪網站內容。

操作方法

用戶只需在 Cloudflare 控制台的「網路安全」 >「機器人」頁面中,開啟「AI 抓取程式和網路爬蟲」滑鈕即可啟用。

Cloudflare 如何抵禦 AI 機器人

Cloudflare 早已為所有方案的用戶提供 機器人對抗模式(Bot Fight Mode) 服務,透過攻擊簽章比對、啟發式技術、機器學習和行為分析技術,區分「好的」和「壞的」機器人。所謂「好的」AI 機器人會遵守 robots.txt 規則,合法獲取網站內容;而「壞的」機器人則會無視網站規範,強行抓取數據。Cloudflare 也建立了驗證機器人目錄,允許 Googlebot 等「好機器人」註冊,方便網站管理員放行。

Cloudflare 指出,網際網路充斥著 AI 機器人,其服務的前一百萬個網站中,約有 39% 的流量來自這些機器人。儘管 robots.txt 文件能指示機器人哪些內容可以抓取,但如同過去的「Do Not Track」瀏覽器標頭一樣,robots.txt 經常被 AI 機器人無視。

為了解決 AI 機器人規避 robots.txt 規則的問題,Cloudflare 的機器學習評分系統會根據機器人的行為特徵,辨識並封鎖可疑的 AI 爬蟲程式。Cloudflare 強調,將持續監控 AI 機器人的活動,並不斷更新封鎖規則和機器學習模型,確保網站管理員能完全掌控其內容的使用方式,並創造一個讓內容創作者安心發展的網路環境。