首頁 > 技術(shù) > 正文

200個“AI垃圾網(wǎng)站”追蹤 信息雜亂無章毫無可信度_當前看點

2023-06-28 16:40:12來源:中關(guān)村在線  


(資料圖片)

隨著生成式AI的成本降低,越來越多的“垃圾網(wǎng)站”通過使用爬蟲抓取其他網(wǎng)站內(nèi)容,并利用AI重新生成信息。據(jù)報道,目前已經(jīng)追蹤到超過200個此類網(wǎng)站。 今年年初,一家機構(gòu)開始標記這些使用AI生成內(nèi)容的網(wǎng)站。在今年四月份,他們登記了49個相關(guān)網(wǎng)站,到了六月已經(jīng)超過200個。這些被稱為“AI垃圾場”的網(wǎng)站缺乏人類監(jiān)管,信息雜亂無章,沒有任何可信度,其存在的目的只是為了從在線廣告中獲取收益。 調(diào)查顯示,這些“垃圾網(wǎng)站”以誘導(dǎo)用戶點擊訪問為主,通過顯示的廣告賺取收入。

其中有一個名為TNN的網(wǎng)站每天可以生成超過1200篇文章,該網(wǎng)站完全由爬蟲和AI腳本控制。 到六月26日為止,已經(jīng)追蹤標記了277個“AI垃圾網(wǎng)站”,這些網(wǎng)站涵蓋了13種語言,包括中文、英文、阿拉伯語、捷克語、荷蘭語、法文、印尼文、意大利文、韓文、葡萄牙語、菲律賓語、泰文及土耳其語等。 事實上,這種利用爬蟲批量抓取其他媒體信息,并在抓取的頁面中加入大量廣告,并通過吸引訪問者獲取廣告補貼的網(wǎng)站,在AI時代來臨之前就已經(jīng)相當常見,而生成式AI的普及只是降低了這些網(wǎng)站的運營成本。 同時,一些在線廣告平臺的政策明確表示,不允許在自動生成的內(nèi)容網(wǎng)站文章中使用它們的廣告API,但這些“垃圾網(wǎng)站”大多數(shù)都違反了這一政策。

標簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀