每天資訊AI作畫的人機戰爭走向何方?

菜單

AI作畫的人機戰爭走向何方?

AI作畫的人機戰爭走向何方?

圖片來源@視覺中國

文|腦極體

AI對於人類職業的影響及其引發的輿論波瀾,迅猛到讓人難以想象。還記得2017年,AI還是個標準的新生事物,我們的核心工作之一就是向讀者們解釋,同聲傳譯、漫畫作家、主持人等人類工作短期內仍是無法被AI取代的。而到了今年,一場因AI作畫而引發的人類畫家危機大討論卻在國內外社交媒體上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……這些從文字生成影象的AI作畫工具大量出現,越來越受歡迎,市面上由AI生成的畫作越來越多,不斷重新整理著大眾對AI能力邊界的認知,大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮,噴湧而出。

在AIGC的激變時刻,關於AI作畫的法律、倫理等問題也變得愈發重要,這場人機戰爭究竟走向何方?我們嘗試用一文說清整個事件的起承轉合。

起:引發眾怒的科技與狠活

AI生成的藝術畫作已經存在了很長時間,2017年,AI繪畫就成為佳士得、蘇富比等高階拍賣場所的座上賓,拍出過數百萬美元的高價,除了引發行業內人士的一些分析和唏噓之外,大眾輿論場並沒有掀起什麼波瀾。

然而,對AI作畫的聲討,卻在近幾個月來,在社交媒體中發展到了一個高峰。

其二,輿論危機波及幾乎所有主流AI繪圖工具。mimic事件直接激發了大量畫師和讀者對AI的不滿情緒,有人刪除了自己的公開畫作,有人開始訴諸法律條文,一時間針對資料版權、技術倫理等的爭議,也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發現,一些很火的工具如NovelAI,訓練學習所使用的資料來源網站也存在上傳無授權圖片的情況。

網站Danbooru釋出的宣告顯示,像NovelAI這樣的生成器是在數千個網站的數十億張圖片上進行訓練的,包括Pixiv、Twitter、DeviantArt和Tumblr等藝術家網站,以及Reddit、Pinterest等網站,所以從Danbooru平臺上刪除作品並不會阻止AI繼續使用畫家在其他網站的作品。也就是說,只要是網路上開放的,就有可能成為學習資料,除了詢問模型的開發者之外,沒有其他方法可以阻止自己的作品被AI學習,除非畫家把自己的畫全網都刪完,否則也很難一一查清楚是否被用來學習了。

AI作畫的人機戰爭走向何方?

其三,個人使用AI作畫出現了大量爭議現象。隨著開發門檻的降低,大量個人AI開發者使用開源工具也出現了大量意料之外的情況,比如有人使用AI生成yhsq等違規內容。9月6日,用AI繪圖工具Midjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會藝術比賽上獲得數字類別中的頭獎,也引發了不小的爭議,因為作者所付出的勞動就是輸入描述文字,AI就會將畫作按需求創作出來,被網友認為是“見證了藝術的死亡”“沒有意義,沒有靈魂”,藝術家Genel Jumalon更直言,“用一幅AI畫作在藝術領域獲得一等獎,真是該死的事”。

擔心AI取代人類畫師,將AI作畫視為對人類能力的貶低,成為一種正在傳染的情緒。

如前所說,AI生成繪畫並不是什麼新鮮事物,為什麼偏偏近期突然在大眾群體中掀起了水花,引發眾怒?人當然不是隻靠最後一根稻草壓垮的。

承接:AI作畫的內卷之路

有必要先來簡單瞭解一下,AI作畫是如何在幾年間從拍賣行、收藏家們關注的小眾藝術,成長為大眾創作的主流標配。

計算機視覺一直是深度學習的主要任務方向之一,包括目標識別、目標跟蹤、影象分割、圖形處理等,有著大量成熟且廣泛的應用。具體到影象生成領域,2015年左右,AI藝術創作主要是透過基於卷積神經網路的遷移學習,來進行影象風格轉換,先對影象內容進行語義分割,再將內容和場景透過線條彎曲、風格遷移等手法,轉換成指定藝術風格,類似美顏軟體的“濾鏡”功能。顯然,這種生成方法的藝術價值並不高,能一鍵p圖的人也並不因此就自認是大藝術家,而且經常出現很鬼畜的作品,谷歌深度學習繪畫系統DeepDream加工過的圖片就十分詭異。

AI生成真正開始展現出藝術價值和媲美人類的水平,是從2016年生成對抗網路GAN(Generative Adversarial Nets)的走紅開始的,GAN模型的原理就是讓生成器網路和判別器網路相互對抗,從而創作出真實度和準確度都更高的全新影象。這一時期,各種XXGAN的影象生成器出現,誕生了大量“以假亂真”的藝術作品。2018年10月佳士得以43。25 萬美元的價格拍賣了由AI創作的《愛德蒙·貝拉米肖像》,成為人類歷史上首次AI藝術品拍賣。

但是,GAN也不能擺脫傳統AI深度模型的問題:無法理解“邏輯”和“常識”,比如AI能夠根據文字關鍵詞把元素堆疊在一起,但因為無法理解隱藏在自然語言背後的邏輯關係,所以經常會畫出非常“克蘇魯”的反常識作品。而改變,來自預訓練大模型的興起。

透過大規模資料和暴力計算而訓練出來的大模型,展現出了強大的魯棒性,不僅在機器視覺領域表現優異,而且還不斷迭代出了跨模態生成的能力,推動AI生成從語言走向視覺。這一波 “文字轉影象”繪畫工具能夠產生以假亂真的畫作,背後的“腦力”普遍來自大模型基礎技術的支撐。在AI繪畫工具上展開技術競賽的谷歌、OpenAI、百度等都是大模型技術的佼佼者和AIGC的推動者。

讀懂了AI作畫的技術傳承之路,也就不難理解,為什麼AI創作的爭議會在此時此刻被髮酵。

首先, 巨頭雲集,技術進展超乎想象。AI作畫匯聚了大量科技巨頭“亮肌肉”,包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者,使得技術突飛猛進,工具數量以前所未有的速度爆發性增長,AI作畫(影象生成)能力也因內卷而達到令人震驚的水平。2021年1月,OpenAI推出了DALL-E一年後,又推出了最新的DALL·E 2,解析度提高4倍,可以從自然語言的描述中建立逼真的影象。谷歌內部就卷出了多個AI繪圖工具,包括Imagen、Parti等,微軟推出的AI繪圖平臺則起名為NUWA女媧,足見野心不小。

大模型優秀的生成效果,使得AI作畫具備了一定的實用性和商用潛力,包括結合文字生成插畫、創意工作的初樣展示、自動完成勾線等重複機械勞動等,AIGC在走向產業的同時自然面臨傳統從業者的懷疑。

其次,大模型的積極開源,讓AI作畫門檻一降再降。

這一輪主流的AI繪圖工具都選擇了開源,繁榮大模型的開發生態,降低技術的使用門檻,任何人都可以使用這些工具進行創作,有的甚至是免費的。比如英國初創公司Stability AI打造的StableDIffusion就完全開放,OpenAI在9月28日開放了Dall-E 2 並提供免費試用,NovelAI在10月3號開放,都吸引了大量使用者前去使用。

相比此前AIGC只作為小眾藝術品和收藏投資物件,基於大模型的AIGC讓更多人參與到訓練、開發和使用中來。儘管各個開源社群都明確公佈了智慧財產權相關規定,包括不得用於成人內容、仇恨或暴力影象,避免使用受版權保護的材料。但隨著使用者的增多和門檻的下降,一旦有人不瞭解並遵守開源社群的智慧財產權規範和協議,違規情況就難免發生。

另外,法律空白與滯後,令原創者對維權感到無能為力。

依靠開源社群的約束是很難避免AI濫用,那麼能不能依靠數字作品的專項法規來保護原創者的智慧財產權呢?現狀顯然是令人失望的,立法作為一件非常嚴肅的事情,往往具有一定的滯後性。與飛速發展的AI技術相比,對於AI生成的作品是否具有智慧財產權/著作權,利用AI生成違規影象如何處理,相關法律法規在全球範圍內都還在空白和討論階段,目前只有個案作為參考。2019年斯蒂芬·泰勒(Stephen Thaler)希望將他發明的DABUS人工智慧系統命名為“發明者”,並獲得相關發明專利,但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來,在全球範圍內,知識產權制度更注重人類創造,使用AI並點選“go”並不被認為是創造性行為。比如深圳市南山法院就曾判定在一起案件中,AI輔助協作系統生成的文章,受到著作權法保護,擅自複製傳播需要承擔相應的民事責任。

智慧財產權本身就存在的判定難、維權難的特點,而AI生成內容法律保護的“缺位”,更加劇了維權的難度,很難約束違規使用,這也使得人類原創畫師面對AI繪畫工具,其智慧財產權也處於“真空”地帶。

技術、文化、倫理與法律等各種因素交織在一起,構成了開篇中AI作畫的種種爭議和風波的緣起,這是一個環環相扣的故事。

轉與合:創作者的激變與新機

那麼,有爭議是不是意味著AI作畫就此停滯了呢?還真不是!

事實上,經過頻繁的討論,大量原創畫師對於AI繪畫工具都有了一定的嘗試和了解,從一些知名畫師的反饋來看,對於AI作畫這樣的AIGC應用,普遍表現出了三種態度。

1。AI想取代人類畫師,還早。

某博主測試過後發現,“搞出來的能看的圖多少有一些,但符合描述意圖的圖基本可以說沒有”;“AI畫畫其實在我這個修圖師眼裡其實跟ps裡那個填充功能差不多”。原因在於,AIGC的內容質量還有提升的空間。一方面,AI大模型的自然語言理解能力與人類還有很大的差距,GPT-3所生成的文字也就相當於小學生水平,這種情況下要讓AI繪圖工具理解複雜的文字,並準確用影象表達出內容思想,還是有點困難的。另一方面,在商業上,藝術品市場推崇的都是極富獨特性的作品,稀缺性一直是藝術品重要的定價標準,工業化、批次產出的東西對收藏家來說沒有價值,隨著AI繪畫工具的開源,手工製作的獨特產品或許才會成為人們追求的藝術。這種趨勢其實已經出現了,有網友就認為未來約稿很可能“純手工”“零AI”反而會成為賣點。

一位創作博主直言:標榜自己的圖是手工繪圖的畫師,今後想要過得富足,或許需要儘量為自己的作品附加額外的價值——這種生活方式早已有人在運營,那就是藝術家們。

所以至少目前為止,AI繪畫工具能提供很多幫助,但還是無法取代人類畫師的。

2。AI作畫,確實有點用。

需要注意的是,藝術創作、藝術品收藏是一種相對小眾的活動,能夠成為藝術家的是極少數極小眾的一批人。不過,日常生產生活中存在大量視覺和設計工作。在這些領域中,AI已經能夠扮演非常有用的“作圖助理”角色,成為大勢所趨。

一種是減少重複性/風險性工作。比如視覺創意中,與客戶溝通耗費大量時間和精力,存在大量不確定性,經常畫完即使版後客戶說“還是第一版好”,遇到這種讓美工自閉的情況,AI就可以扮演起一個任勞任怨的乙方,快速生成多樣化的AI創意圖片,避免了過重的前期投入乃至返工。另外,每逢節日大促活動,美工難免就會遇到大量重複枯燥的工作,比如製作高度同質化的海報,也可以由高水準的AI能力來完成。因此有設計師將DALL·E命名為“傻逼甲方終結者”。

另一種是AI作為輔助工具,提高設計師的工作效率。許多基於AI繪圖工具都已經被開發為Figma、Photoshop、Blender等工具的外掛,幫助創作者渲染細節、一鍵填色、提供靈感……而對於沒有受過系統性繪畫訓練的普通人來說,藝術創作的門檻也大大降低了,有網友用Midjourney合成了去世祖母在花叢裡的照片,有網友用它為自己寫的同人小說製作插畫,這些在大模型和AIGC出現之前,都只能委託給專業畫家,歷經漫長的等待來完成,而現在用AI繪圖只需一鍵即可完成。

普通人也能低成本甚至零成本地實現腦洞,AI大模型支撐下的創作自由才剛剛開始,因此也有創作者直言,“AI繪畫是在造福人類”。

3。AI智慧財產權保護,需要加速。

對於創作者來說,AI繪畫工具無疑是絕佳輔助,與此同時,避免AIGC的野蠻生長,因一些違規作畫的操作而陷入爭議和負面,也成為藝術界、AI界、法律界在一起共同討論、加速立法的當務之急。

目前來看,AI作畫的智慧財產權爭論焦點主要集中在三個方面:1。資料版權。AI模型訓練對於樣本資料的數量和覆蓋廣度有要求,如何確保資料版權的來源並予以保護;2。創作版權。資料只是侵權的第一步,“畫風抄襲”是畫師們非常苦惱的一種侵權,AI生成畫作的元素、風格相似度要判定是否抄襲,比判定人類抄襲作品的難度更大;3。利益保護。目前大量AI繪畫工具都提供付費服務,而一旦AI生成技術商用以後,作為資料來源頭或創作者的人如何獲得合理回報和收益,目前也沒有有效的解決方案和保護手段。所以DALL-E 2直接規定,其使用者無法出售用它創作的任何藝術品。但如果能有一種措施,準確判斷貢獻度並將收益分配給貢獻者,比如聯邦學習技術、區塊鏈技術等的支援下,相信許多原創者也樂於參與到AIGC的產業化程序中。

有了法律與技術的保障,AI作畫才能在邊界內加速人機合作,而非割裂與衝突。

總而言之,現代文明的演進,是一個世界的祛魅過程。工業化的過程,就是用蒸汽機、電氣化等科學技術的系統運用,去取代那些能工巧匠們的奧秘,而這個祛魅過程,也帶來了生產的大批次、高效率和低成本,普羅大眾的生活比傳統時代的任何時候都要便利和富足。

從這個意義來看,AIGC何嘗不是一個藝術祛魅的過程。就像Midjourney主創所說:美麗的石頭來自河流,但河流不是創作者。這套AI系統並無創造的能力,但美可以來自其中。(Every beautiful stone comes from the river, but is the river creative? No, I don’t think so。 Is the system creative? No。 Can beauty come out from it? Yes。 )

沒有什麼能瓦解人的靈魂和創造力,就像攝影術不會瓦解梵高和莫奈。智慧時代,擁抱AI已成定局,這個程序中,人如何尋找到人的價值與意義,將是我們每個人所共同面臨的一個課題。