你上一次懷疑網上文章是否出自真人手筆是什麼時候?這個問題如今已不再是哲學思辨。史丹福大學、倫敦帝國學院與網路檔案館的劃時代研究給出了一個令所有內容創作者、搜尋引擎和讀者都該擔憂的答案:自2022年以來,約有35%的新建網站內容為AI生成或AI輔助創作。到2025年中,這個數字已經讓網路跨越了一個需要數十年人類努力才能建立的臨界點。
這項名為《AI生成文本對網路的影響》的研究,分析了2022年8月至2025年5月間共33個月的網路內容。研究團隊使用Pangram v3這款AI檢測工具——他們驗證過這是目前最準確的選項——對透過時光機備份存取的網站快照進行分類。在ChatGPT於2022年底問世之前,這個數字幾乎為零。到了2025年,超過三分之一的新網路內容來自機器。
論文共同作者、史丹福AI研究者喬納什·多萊扎爾稱這個速度「令人震驚」:「經過數十年的人類塑造,網路的重要部分在短短三年間已被AI定義。這是我見過的數位景觀重大轉型,其速度是當初建構互聯網所耗費時間的零頭。」
這項發現的影響遠超數字本身。研究團隊檢驗了關於AI內容的六項常見憂慮:是否縮窄觀點多樣性、是否因幻覺問題加劇虛假資訊、是否產生過度正面和簡化的文章、是否忽略引用來源、是否生成低語義密度的文字段落、是否造成同質化的寫作單一文化。在風格層面,數據確認了許多讀者的直覺:AI生成文本趨向樂觀且精簡。網路正在變得更加「陽光」卻更不啰嗦。這是否為進步,完全取決於你對網路應有的樣子的定義。
對SEO從業者和內容行銷者而言,這組數字既是機會也是生存威脅。當三分之一的競爭網頁能在數秒內被語言模型生成時,關於關鍵詞密度和反向連結的老規矩已成為歷史。新鮮、真正由人類生成的內容——展示AI仍難以真實複製的專業素養——可能因其稀缺而成為高端資產。搜尋引擎面臨自身危機:以AI內容訓練AI內容來識別AI內容,可能造成相關性隨時間衰退的反饋循環。
對研究者、新聞從業員和所有以網路為主要資訊來源的人來說,信任的衡量標準已經改變。論文作者指出,AI生成內容「被擔憂會導致語義和風格多樣性、內容準確性等方面的退化」。這些憂慮不再是理論推演。它們已被測量、量化,並持續增長。
「幽靈網路理論」——即大部分網路現在只是機器人相互對話的產物——最初只是陰謀論。三年間AI的積極部署已使其部分成真。問題不再是機器能否產出令人信服的文字。它們顯然可以。問題是人類是否會注意到、在意,或發展出新的媒介素養,來應對合成內容與真實內容比例不斷攀升的網路世界。