網際網路上的互動預設執行某種經濟契約,那就是創作者與通路之間的契約。無論作家、評論家、部落客、設計師是獨立創作,還是受雇於某間公司,都知道自己發布的作品,會藉由社群網路與搜尋引擎的傳播,帶來經濟回報。創作者帶來供給,通路帶來需求。
Google 搜尋就是典型的例子。Google的網路爬蟲從網頁上抓取內容,分析整理之後摘錄其中一段貼入搜尋結果。創作者提供內容,Google的排名連結提供流量。有了流量,新聞業者與各種內容提供者就能藉由廣告、訂閱,或是自己想要的各種商業模式來賺錢。
這種模式在1990年代剛出現的時候,許多內容提供者都沒有看到背後暗藏的危險。在著作財產權法中,搜尋引擎的行為屬於合理使用(fair-use exemption),並未侵犯版權,而內容提供者這時候也不想出手改變。但隨著網際網路不斷發展,搜尋引擎的談判條件愈來愈好,兩者的力量差異愈來愈大。整個網際網路的大量內容,逐漸由少數幾個搜尋引擎集中檢索,使搜尋引擎逐漸為所欲為。我隨便舉個例子,現在網際網路的搜尋市場有80%以上掌握在Google手裡,全世界沒有任何一個內容提供者的市占率這麼高。
某些媒體試圖亡羊補牢。媒體大亨「新聞集團」(NewsCorp)十幾年來一直抗議Google的搭便車行為,並以正式提出反壟斷訴訟等方法,試圖索取更多金錢,最後在2021年和Google 達成廣告分潤協議。使用者評價網站Yelp則打從成立以來就一直努力制衡Google,最後執行長傑瑞米•斯托普曼(Jeremy Stoppelman)站上國會聽證台,他說:
科技巨頭的問題,在於它們掌握市場中的關鍵環節:
通路。當每個人上網時都先得透過Google搜尋,嚴重到Google可以擋在消費者面前,阻止他們看到最好的資訊,市場的問題就大了,大到足以扼殺創新。
當通路能夠決定消費者眼中的資訊,內容提供者就沒有談判籌碼。自從Google在2000年代成為搜尋霸主之後,就沒有人能夠拒絕Google的存取。如果Yelp和新聞集團拒絕Google,就會失去流量,把市場白白送給其他競爭者。
如果內容提供者在1990年代就知道會發生這種事,當初就可能集合起來聯合對抗。如果它們有這麼做,今天手中就會有更多談判籌碼。然而,內容提供者各自為政,如今每個人的力量都極為渺小,而且沒有集體組織,自然就被各個擊破。(那些看見結局的人甚至因此走向另一邊,像是南非報紙大亨Naspers 決定縮小新聞部門,把主力轉向網路投資,如今則成為網路巨頭。)
這樣的發展讓通路笑得合不攏嘴。如今Google這個搜尋巨頭陸續達成多次和解,並且提高出版者的分潤,讓更多內容提供者得以生存。因為它一方面需要有人持續提供內容,一方面還得面對監理機關的施壓。況且它在之前的幾年之內早已賺得缽滿盆滿,如今撥出幾個小錢根本微不足道。
Google 甚至好幾次直接踩過底線。網站最怕的事情之一就是被「整碗捧去」(one-boxing):搜尋引擎直接複製網站的內容,把摘要貼在搜尋結果上,使用者根本不用點選原始網站就能知道答案。電影、歌詞、餐廳這類網站通常都會被「整碗捧去」,而且這對仰賴流量的新創公司而言,無疑是宣判死刑。諷刺的是,我參與的好幾間公司都碰過這樣的事,流量一夕蒸發,收入也瞬間消失。
不久之後,網路上的很多內容都有可能被人工智慧「整碗捧去」。最新的人工智慧已經可以整理網站摘要,使用者一個鍵都不用按,就可以得到內容提供者放上網的資訊。OpenAI發布的超級聊天機器人ChatGPT就是一個例子,你可以請它列出一串適合的餐廳,或要求它整理相關新聞,它會直接輸出一篇完整的答案,不需要你再逐一點選各個網站。如果這成為一種新的搜尋方式,整個網際網路就會被人工智慧搜刮殆盡,內容提供者與搜尋引擎之間幾十年來的商業互利也從此終結。
人工智慧最近已經強大到不可思議。無論是大型語言模型機器人,還是Midjourney這種生成藝術(Generative Art)系統,都正以接近指數的速度飛快進步。人工智慧大概會在接下來的十年令人驚喜連連,大幅提升許多應用場景的經濟生產力,明顯改善人們的生活。但人工智慧的力量愈大,就表示愈需要新的經濟模式,才能讓內容提供者繼續賺錢。
如果人工智慧能夠直接回答正確的答案,就會取代搜尋引擎大部分的功能,並使原始網站乏人問津。如果人工智慧可以在幾秒內生出圖像,為什麼還要大費周章去搜尋原作,向原作者申請授權?如果人工智慧可以整理新聞摘要,為什麼還要浪費時間閱讀原始報導?網際網路上有很多東西,都會被人工智慧「整碗捧去」。
目前大多數人工智慧系統都沒有設定好要怎麼和創作者彼此互利。以圖片生成為例,Midjourney這類圖片生成系統,利用數以萬計的圖片來訓練大型神經網路。這些圖片都帶有文字標記,神經網路訓練得愈好,就愈能夠根據標記上的文字,找到圖片中的相應元素,揉合之後輸出新的圖片。目前人工智慧的產物,已經常常和人類的原作難以區分。而且這些系統明明使用網路上的資源來訓練,輸出圖片時卻不會引用來源,也不會分錢給原作者。企業表示這些人工智慧只是學習,而非抄襲,並未侵犯原作的版權。他們認為人工智慧就像是人類藝術家,從其他作品汲取靈感,自己畫出新的作品。
這種說法在目前的智慧財產權法中似乎完全合理(當然,進行相關訴訟時,甚至立法過程中可能會有不少辯論)。但是,建立一個新的合作模式,讓人工智慧與內容提供者彼此互利,才是真正的長久之計。人工智慧需要不斷吸收新知:人們的品味不斷變化,新的流派不斷出現,新的東西不斷發明。沒有最新穎的資料,人工智慧就無法描述最新穎的潮流。但提供這些資料的人,應該要獲得合理的報酬。
人工智慧的發展帶來幾種可能的未來。第一種是人工智慧繼續照著目前的做法為所欲為:人工智慧繼續拿走人們的作品,繼續使用並回應使用者的需求,不向人們分享任何一點名聲或利潤。如果未來這麼發展,創作者就會試圖刪除網路上的作品,或者把作品鎖在付費牆後面,阻止人工智慧拿它來做訓練。目前許多服務業者正在這麼做,它們築起長城,縮小API的存取範圍。
但這種時候,公司可能會自製內容來訓練人工智慧。目前的「內容農場」(content farm)就是這樣:一大群工人擠在狹小的辦公室,照著上級的指示生產特定的內容,加入訓練資料庫。在這個未來,人工智慧也許會繼續進步,但整個世界注定陷入黯淡:機器決定進步的道路,人類淪為無足輕重的零件。
所幸我們還有第二種未來,那就是在人工智慧與內容創作者之間建立新的契約,創造出真實有底蘊的作品,打敗內容農場。其中最有用的方法就是設計新的網路,使人工智慧與內容創作者能夠在經濟上雙贏。
為什麼新的契約需要新的網路?讓每個創作者自己選擇要加入哪個人工智慧訓練資料庫,最後市場不就會自然而然達到平衡嗎?
1990 年代的搜尋引擎發展史,已經證明這招無效。當時的網頁標準組織在robots.txt檔案規格中設計出「noindex」標籤,禁止搜尋引擎檢索。但內容提供者很快就發現,只要其他網站繼續允許檢索收錄,退出搜尋引擎的網站就只會白白損失流量,得不到任何補償。如果是單一個網站就很脆弱,但只要各個網站團結起來共同鬥爭,發動集體談判,便能保有利益。只不過這些網站從來沒有這麼做。
拒絕人工智慧的內容提供者,也會走向同樣的悲劇。市場會被其他內容提供者搶走,沒人提供的部分會由內容農場補足。而且這種狀況的問題比受到搜尋引擎控制更嚴重,因為靈感與意象會自由流動,只要有幾個作品向你致敬或對話,並且允許人工智慧使用,電腦就有可能學到足以揉合重製的內容。面對人工智慧的同化威脅,創作者孤軍反抗注定無用。
要建立新的經濟契約,我們可以使用區塊鏈網路。而且區塊鏈本身就是集體談判的機器,非常適合一大群人共同協調經濟利益,尤其在談判雙方權力不對等的時候更是有利。區塊鏈的抽成率低、規則固定,並且能讓貢獻者獲得回報。整個網路還能由提供內容的創作者與人工智慧廠商共同治理,確保網路的運作忠於使命。
有了區塊鏈,創作者就能直接把作品的使用條款寫進軟體,包括人工智慧訓練等各種商業使用授權,之後交由程式強制執行。區塊鏈上的分配系統,會從人工智慧的收入中,自動撥一部分給之前提供作品來訓練的創作者。這會變成集體談判的籌碼,人工智慧公司如果拒絕加入,就會失去一整批訓練資料,而且無法靠著強大財力來威脅個別創作者。工會就是這樣守護勞工權益;人多力量大。
能不能用企業網路來打造這種集體談判系統?可以,而且應該會有人去做。但這個系統注定走上企業網路的老路,例如招募夠多會員之後開始割韭菜。擁有企業網路的人,遲早有一天會開始跟會員收費,以及修改規則藉以自肥。
我希望的網際網路,是一個鼓勵人們發揮創意並以此謀生的地方。如果人們在網路上不斷創造,並開放給所有人使用,整個網路就會愈變愈好。人工智慧不斷學習創作者的心血,卻沒有回饋自己的成果。它難道不應該把一部分的經濟果實,分享給每一個環節上的每一位創作者嗎?看看搜尋引擎與社交網路靠著網友貢獻的內容,如今每天獲取多少資金,它們應該把一部分的錢撥給當初貢獻內容的人。
每一個使用網路的人都該問問自己,當我做了某些有價值的事情,有沒有獲得報酬?答案通常都是沒有。企業網路把談判條件集中到少數幾個科技巨頭手中,讓它們決定每個人能拿多少錢。搜尋引擎與社群網路這類網路已經非常成熟,使用者很難退出,談判的平衡很難改變。但人工智慧這些網路才剛剛出現,我們可以從頭制定合理的經濟規則。
我們必須在市場結構確定之前,動手決定未來的走向。我們要讓內容農場來訓練人工智慧,還是讓機器與創作者攜手互利並進?我們要讓機器去協助人,還是讓人服侍機器?這是人工智慧時代的關鍵問題。