AI作畫的人機戰爭走向何方？

圖片來源@視覺中國

文｜腦極體

AI對於人類職業的影響及其引發的輿論波瀾，迅猛到讓人難以想象。還記得2017年，AI還是個標準的新生事物，我們的核心工作之一就是向讀者們解釋，同聲傳譯、漫畫作家、主持人等人類工作短期內仍是無法被AI取代的。而到了今年，一場因AI作畫而引發的人類畫家危機大討論卻在國內外社交媒體上演。

DALL-E 2， Stable Diffusion， Midjourney， DreamBooth AI， Wombo Dream， Make-A-Video， Novel AI……這些從文字生成影象的AI作畫工具大量出現，越來越受歡迎，市面上由AI生成的畫作越來越多，不斷重新整理著大眾對AI能力邊界的認知，大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮，噴湧而出。

在AIGC的激變時刻，關於AI作畫的法律、倫理等問題也變得愈發重要，這場人機戰爭究竟走向何方？我們嘗試用一文說清整個事件的起承轉合。

起：引發眾怒的科技與狠活

AI生成的藝術畫作已經存在了很長時間，2017年，AI繪畫就成為佳士得、蘇富比等高階拍賣場所的座上賓，拍出過數百萬美元的高價，除了引發行業內人士的一些分析和唏噓之外，大眾輿論場並沒有掀起什麼波瀾。

然而，對AI作畫的聲討，卻在近幾個月來，在社交媒體中發展到了一個高峰。

其二，輿論危機波及幾乎所有主流AI繪圖工具。mimic事件直接激發了大量畫師和讀者對AI的不滿情緒，有人刪除了自己的公開畫作，有人開始訴諸法律條文，一時間針對資料版權、技術倫理等的爭議，也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發現，一些很火的工具如NovelAI，訓練學習所使用的資料來源網站也存在上傳無授權圖片的情況。

網站Danbooru釋出的宣告顯示，像NovelAI這樣的生成器是在數千個網站的數十億張圖片上進行訓練的，包括Pixiv、Twitter、DeviantArt和Tumblr等藝術家網站，以及Reddit、Pinterest等網站，所以從Danbooru平臺上刪除作品並不會阻止AI繼續使用畫家在其他網站的作品。也就是說，只要是網路上開放的，就有可能成為學習資料，除了詢問模型的開發者之外，沒有其他方法可以阻止自己的作品被AI學習，除非畫家把自己的畫全網都刪完，否則也很難一一查清楚是否被用來學習了。

其三，個人使用AI作畫出現了大量爭議現象。隨著開發門檻的降低，大量個人AI開發者使用開源工具也出現了大量意料之外的情況，比如有人使用AI生成yhsq等違規內容。9月6日，用AI繪圖工具Midjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會藝術比賽上獲得數字類別中的頭獎，也引發了不小的爭議，因為作者所付出的勞動就是輸入描述文字，AI就會將畫作按需求創作出來，被網友認為是“見證了藝術的死亡”“沒有意義，沒有靈魂”，藝術家Genel Jumalon更直言，“用一幅AI畫作在藝術領域獲得一等獎，真是該死的事”。

擔心AI取代人類畫師，將AI作畫視為對人類能力的貶低，成為一種正在傳染的情緒。

如前所說，AI生成繪畫並不是什麼新鮮事物，為什麼偏偏近期突然在大眾群體中掀起了水花，引發眾怒？人當然不是隻靠最後一根稻草壓垮的。

承接：AI作畫的內卷之路

有必要先來簡單瞭解一下，AI作畫是如何在幾年間從拍賣行、收藏家們關注的小眾藝術，成長為大眾創作的主流標配。

計算機視覺一直是深度學習的主要任務方向之一，包括目標識別、目標跟蹤、影象分割、圖形處理等，有著大量成熟且廣泛的應用。具體到影象生成領域，2015年左右，AI藝術創作主要是透過基於卷積神經網路的遷移學習，來進行影象風格轉換，先對影象內容進行語義分割，再將內容和場景透過線條彎曲、風格遷移等手法，轉換成指定藝術風格，類似美顏軟體的“濾鏡”功能。顯然，這種生成方法的藝術價值並不高，能一鍵p圖的人也並不因此就自認是大藝術家，而且經常出現很鬼畜的作品，谷歌深度學習繪畫系統DeepDream加工過的圖片就十分詭異。

AI生成真正開始展現出藝術價值和媲美人類的水平，是從2016年生成對抗網路GAN（Generative Adversarial Nets）的走紅開始的，GAN模型的原理就是讓生成器網路和判別器網路相互對抗，從而創作出真實度和準確度都更高的全新影象。這一時期，各種XXGAN的影象生成器出現，誕生了大量“以假亂真”的藝術作品。2018年10月佳士得以43。25 萬美元的價格拍賣了由AI創作的《愛德蒙·貝拉米肖像》，成為人類歷史上首次AI藝術品拍賣。

但是，GAN也不能擺脫傳統AI深度模型的問題：無法理解“邏輯”和“常識”，比如AI能夠根據文字關鍵詞把元素堆疊在一起，但因為無法理解隱藏在自然語言背後的邏輯關係，所以經常會畫出非常“克蘇魯”的反常識作品。而改變，來自預訓練大模型的興起。

透過大規模資料和暴力計算而訓練出來的大模型，展現出了強大的魯棒性，不僅在機器視覺領域表現優異，而且還不斷迭代出了跨模態生成的能力，推動AI生成從語言走向視覺。這一波 “文字轉影象”繪畫工具能夠產生以假亂真的畫作，背後的“腦力”普遍來自大模型基礎技術的支撐。在AI繪畫工具上展開技術競賽的谷歌、OpenAI、百度等都是大模型技術的佼佼者和AIGC的推動者。

讀懂了AI作畫的技術傳承之路，也就不難理解，為什麼AI創作的爭議會在此時此刻被髮酵。

首先，巨頭雲集，技術進展超乎想象。AI作畫匯聚了大量科技巨頭“亮肌肉”，包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者，使得技術突飛猛進，工具數量以前所未有的速度爆發性增長，AI作畫（影象生成）能力也因內卷而達到令人震驚的水平。2021年1月，OpenAI推出了DALL-E一年後，又推出了最新的DALL·E 2，解析度提高4倍，可以從自然語言的描述中建立逼真的影象。谷歌內部就卷出了多個AI繪圖工具，包括Imagen、Parti等，微軟推出的AI繪圖平臺則起名為NUWA女媧，足見野心不小。

大模型優秀的生成效果，使得AI作畫具備了一定的實用性和商用潛力，包括結合文字生成插畫、創意工作的初樣展示、自動完成勾線等重複機械勞動等，AIGC在走向產業的同時自然面臨傳統從業者的懷疑。

其次，大模型的積極開源，讓AI作畫門檻一降再降。

這一輪主流的AI繪圖工具都選擇了開源，繁榮大模型的開發生態，降低技術的使用門檻，任何人都可以使用這些工具進行創作，有的甚至是免費的。比如英國初創公司Stability AI打造的StableDIffusion就完全開放，OpenAI在9月28日開放了Dall-E 2 並提供免費試用，NovelAI在10月3號開放，都吸引了大量使用者前去使用。

相比此前AIGC只作為小眾藝術品和收藏投資物件，基於大模型的AIGC讓更多人參與到訓練、開發和使用中來。儘管各個開源社群都明確公佈了智慧財產權相關規定，包括不得用於成人內容、仇恨或暴力影象，避免使用受版權保護的材料。但隨著使用者的增多和門檻的下降，一旦有人不瞭解並遵守開源社群的智慧財產權規範和協議，違規情況就難免發生。

另外，法律空白與滯後，令原創者對維權感到無能為力。

依靠開源社群的約束是很難避免AI濫用，那麼能不能依靠數字作品的專項法規來保護原創者的智慧財產權呢？現狀顯然是令人失望的，立法作為一件非常嚴肅的事情，往往具有一定的滯後性。與飛速發展的AI技術相比，對於AI生成的作品是否具有智慧財產權/著作權，利用AI生成違規影象如何處理，相關法律法規在全球範圍內都還在空白和討論階段，目前只有個案作為參考。2019年斯蒂芬·泰勒（Stephen Thaler）希望將他發明的DABUS人工智慧系統命名為“發明者”，並獲得相關發明專利，但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來，在全球範圍內，知識產權制度更注重人類創造，使用AI並點選“go”並不被認為是創造性行為。比如深圳市南山法院就曾判定在一起案件中，AI輔助協作系統生成的文章，受到著作權法保護，擅自複製傳播需要承擔相應的民事責任。

智慧財產權本身就存在的判定難、維權難的特點，而AI生成內容法律保護的“缺位”，更加劇了維權的難度，很難約束違規使用，這也使得人類原創畫師面對AI繪畫工具，其智慧財產權也處於“真空”地帶。

技術、文化、倫理與法律等各種因素交織在一起，構成了開篇中AI作畫的種種爭議和風波的緣起，這是一個環環相扣的故事。

轉與合：創作者的激變與新機

那麼，有爭議是不是意味著AI作畫就此停滯了呢？還真不是！

事實上，經過頻繁的討論，大量原創畫師對於AI繪畫工具都有了一定的嘗試和了解，從一些知名畫師的反饋來看，對於AI作畫這樣的AIGC應用，普遍表現出了三種態度。

1。AI想取代人類畫師，還早。

某博主測試過後發現，“搞出來的能看的圖多少有一些，但符合描述意圖的圖基本可以說沒有”；“AI畫畫其實在我這個修圖師眼裡其實跟ps裡那個填充功能差不多”。原因在於，AIGC的內容質量還有提升的空間。一方面，AI大模型的自然語言理解能力與人類還有很大的差距，GPT-3所生成的文字也就相當於小學生水平，這種情況下要讓AI繪圖工具理解複雜的文字，並準確用影象表達出內容思想，還是有點困難的。另一方面，在商業上，藝術品市場推崇的都是極富獨特性的作品，稀缺性一直是藝術品重要的定價標準，工業化、批次產出的東西對收藏家來說沒有價值，隨著AI繪畫工具的開源，手工製作的獨特產品或許才會成為人們追求的藝術。這種趨勢其實已經出現了，有網友就認為未來約稿很可能“純手工”“零AI”反而會成為賣點。

一位創作博主直言：標榜自己的圖是手工繪圖的畫師，今後想要過得富足，或許需要儘量為自己的作品附加額外的價值——這種生活方式早已有人在運營，那就是藝術家們。

所以至少目前為止，AI繪畫工具能提供很多幫助，但還是無法取代人類畫師的。

2。AI作畫，確實有點用。

需要注意的是，藝術創作、藝術品收藏是一種相對小眾的活動，能夠成為藝術家的是極少數極小眾的一批人。不過，日常生產生活中存在大量視覺和設計工作。在這些領域中，AI已經能夠扮演非常有用的“作圖助理”角色，成為大勢所趨。

一種是減少重複性/風險性工作。比如視覺創意中，與客戶溝通耗費大量時間和精力，存在大量不確定性，經常畫完即使版後客戶說“還是第一版好”，遇到這種讓美工自閉的情況，AI就可以扮演起一個任勞任怨的乙方，快速生成多樣化的AI創意圖片，避免了過重的前期投入乃至返工。另外，每逢節日大促活動，美工難免就會遇到大量重複枯燥的工作，比如製作高度同質化的海報，也可以由高水準的AI能力來完成。因此有設計師將DALL·E命名為“傻逼甲方終結者”。

另一種是AI作為輔助工具，提高設計師的工作效率。許多基於AI繪圖工具都已經被開發為Figma、Photoshop、Blender等工具的外掛，幫助創作者渲染細節、一鍵填色、提供靈感……而對於沒有受過系統性繪畫訓練的普通人來說，藝術創作的門檻也大大降低了，有網友用Midjourney合成了去世祖母在花叢裡的照片，有網友用它為自己寫的同人小說製作插畫，這些在大模型和AIGC出現之前，都只能委託給專業畫家，歷經漫長的等待來完成，而現在用AI繪圖只需一鍵即可完成。

普通人也能低成本甚至零成本地實現腦洞，AI大模型支撐下的創作自由才剛剛開始，因此也有創作者直言，“AI繪畫是在造福人類”。

3。AI智慧財產權保護，需要加速。

對於創作者來說，AI繪畫工具無疑是絕佳輔助，與此同時，避免AIGC的野蠻生長，因一些違規作畫的操作而陷入爭議和負面，也成為藝術界、AI界、法律界在一起共同討論、加速立法的當務之急。

目前來看，AI作畫的智慧財產權爭論焦點主要集中在三個方面：1。資料版權。AI模型訓練對於樣本資料的數量和覆蓋廣度有要求，如何確保資料版權的來源並予以保護；2。創作版權。資料只是侵權的第一步，“畫風抄襲”是畫師們非常苦惱的一種侵權，AI生成畫作的元素、風格相似度要判定是否抄襲，比判定人類抄襲作品的難度更大；3。利益保護。目前大量AI繪畫工具都提供付費服務，而一旦AI生成技術商用以後，作為資料來源頭或創作者的人如何獲得合理回報和收益，目前也沒有有效的解決方案和保護手段。所以DALL-E 2直接規定，其使用者無法出售用它創作的任何藝術品。但如果能有一種措施，準確判斷貢獻度並將收益分配給貢獻者，比如聯邦學習技術、區塊鏈技術等的支援下，相信許多原創者也樂於參與到AIGC的產業化程序中。

有了法律與技術的保障，AI作畫才能在邊界內加速人機合作，而非割裂與衝突。

總而言之，現代文明的演進，是一個世界的祛魅過程。工業化的過程，就是用蒸汽機、電氣化等科學技術的系統運用，去取代那些能工巧匠們的奧秘，而這個祛魅過程，也帶來了生產的大批次、高效率和低成本，普羅大眾的生活比傳統時代的任何時候都要便利和富足。

從這個意義來看，AIGC何嘗不是一個藝術祛魅的過程。就像Midjourney主創所說：美麗的石頭來自河流，但河流不是創作者。這套AI系統並無創造的能力，但美可以來自其中。（Every beautiful stone comes from the river， but is the river creative？ No， I don’t think so。 Is the system creative？ No。 Can beauty come out from it？ Yes。）

沒有什麼能瓦解人的靈魂和創造力，就像攝影術不會瓦解梵高和莫奈。智慧時代，擁抱AI已成定局，這個程序中，人如何尋找到人的價值與意義，將是我們每個人所共同面臨的一個課題。

AI作畫的人機戰爭走向何方？

AI作畫的人機戰爭走向何方？

相關文章

推薦文章