每天資訊盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

菜單

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

12月的一天,華為雲AI高階研究員任星一大早就忙著出發,從北京飛往西昌,落地後從西昌機場驅車4個小時,在山林峽谷間來回穿梭,再換乘有經驗的本地車隨“之字形”的盤山公路蜿蜒而上,輾轉大半天,他來到了身處大涼山腹地、海拔2360米的四川省涼山彝族自治州美姑縣採紅村曉明愛心小學。

這次來大涼山採紅村曉明愛心小學,任星一是希望為孩子們帶去一堂生動的科技AI課,從“衣、食、住、行”這些貼近生活的維度,讓孩子們親身體驗到人工智慧、“數字人”、VR等前沿科技;二是他和同事們還為孩子們帶去了一份特別的新年禮物——一件由華為雲盤古AI大模型和時諦智慧一起設計出的新年新衣。

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

當天,拿到新衣服孩子們非常高興,他們歡呼雀躍著,將衣服拋向高空又緊緊抱住,穿上新衣服的他們,不僅開心地圍成圈跳起了彝族達體舞,還頭一次真切地感受到了科技所帶來的神奇和溫度。

那麼,這件由“AI”編織的新衣,究竟有何特別之處?在這背後,華為雲和時諦智慧的小夥伴們又付出了哪些努力呢?

這件新年新衣有點“小特別”

“這件衣服呀,有點小特別,它是人工智慧和人類設計師共同設計的。”任任星課堂上告訴孩子們。

確實如此,不久前,任星在接到其朋友同時也是採紅村曉明愛心小學校長喬丹的電話,喬丹此次來電是希望華為雲能為學校的71名學生帶去一堂AI科普課,此外儘管孩子們已經“不愁吃,不愁穿”,但大涼山的冬天氣溫較低,加上孩子們平時活潑好動,長得快,對於溫暖結實的新衣依然有著很大的需求。

“時間緊,任務重”——為了能夠保證在新年前為孩子們送上新衣,正在從事華為雲盤古大模型研發工作的任星和他的同事們,很快就想到了快速解決這一問題的辦法,那就是可以基於華為雲盤古多模態大模型中的“以文生圖”能力,為孩子們設計新年新衣,為此他們第一時間還聯合了時諦智慧,希望能夠藉助時諦智慧的線上協同設計、實時渲染技術以及完整的產業鏈協同能力,在短時間內完成新衣的設計、製作。

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

為此,雙方選定“派克服”作為新年新衣的版型設計,這種版型設計更加保暖、耐磨、耐髒,且能夠一衣四穿;同時新衣還巧妙地融入了彝族窗格紋、羊角紋、馬纓花紋等民族服飾元素,更兼顧了實用和美觀。

更為關鍵的是,這件有點“小特別”的新年新衣,居然在不到一週時間內就設計完成了,這打破了傳統上需要三週的設計週期限制,要知道傳統的服裝打樣方式通常需要經歷企劃、設計款式圖、確認平面版型、備料配料、製作樣衣、修改樣衣、拍照、定樣、核價、出工藝單等一系列步驟,開發週期通常需要17—30天;其中,設計師蒐集素材的時間往往佔整個製作週期的70%以上,真正花在設計上的時間僅為30%。

但是,這次在這件新衣的設計過程中,藉助華為雲盤古多模態大模型的“以文生圖”能力,時諦智慧的設計師們在企劃階段就能夠獲得數百張符合預期、可二次設計的服裝圖片,大幅節省了在尋找資料和淘汰款式環節所耗費的時間。此外,透過華為雲提供的資料和算力加持,時諦智慧的設計師們將盤古大模型給到的“派克服”參考版式,用線稿的方式快速繪製出,隨後將服裝線稿、花紋等匯入時諦智慧AI服裝設計系統,進行線上材料、顏色、圖案的搭配。在此過程中,時諦智慧的實時渲染技術,線上生成3D樣衣供設計師選擇。

隨後,時諦智慧調動其時尚產業不同領域的豐富供應鏈資源,對確定的3D樣衣進行快速生成以及二次花紋燙印,將設計、生產時間壓縮到了短短的兩週。

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

最終,在出發之前,任星非常從容地帶上了這批新年新衣,圓滿的完成了喬丹校長給他交代的“特別任務”,而坐在教室中的大涼山的孩子們,聽著任星給他們介紹這件衣服是如何做出來的時,既懵懂,又興奮。黑板螢幕上,盤古大模型演示著快速批次生成羽絨服、派克服等衣服樣式,而孩子們輪番上臺按自己的喜好在時諦智慧設計軟體上,切換面料、顏色和圖案……

可以說,這件有點“小特別”的新年新衣,不僅點亮了大涼山孩子們的科技夢,更帶去了科技的溫暖和溫度。

當時尚設計師加持了“盤古”

事實上,這次為大涼山的孩子們設計新年新衣,僅僅只是華為雲盤古多模態大模型的一次“牛刀小試”,為了更好的的助時尚設計師、時尚和服務企業展開工作,華為雲盤古多模態大模型基於億億級然影象進行預訓練,並在十萬級時尚產業資料上進行微調和最佳化,從而得到了非常適合應用於時尚和服裝行業的盤古時尚多模態大模型。

也正因此,今後時尚設計師們就能夠藉助華為雲盤古多模態大模型提供的強大能力,更好地完成設計創作工作,而時尚和服務企業也可以籍此在快速變化的市場中,挖掘到更多的商機,具體而言:

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

首先,是

可以幫助設計師洞察流行趨勢

。盤古多模態大模型可對十萬級時尚產業資料的顏色、版型、圖案等元素進行分析後,批次生成與流行趨勢接近的服飾,將當下流行的時尚元素視覺化地提煉並呈現給設計師,幫助時尚企業與行業洞察使用者的消費意向,預判行業流行趨勢。

其次,是支援生成多樣化的服飾。盤古多模態大模型基於億級自然影象和十萬級時尚產業資料,支援以文生圖,向設計師推薦風格多樣、款式多樣的服飾圖片,包括派克服、羽絨服、開衫等款式,這樣就可以減少設計師蒐集素材的時間,讓設計師能夠在創作前期根據不同的推薦結果快速積累靈感,快速地進入二次創作。

第三,是

幫助批次生成符合要求的服飾圖片。

傳統設計過程中,設計師在搜尋引擎尋找參考時,通常會遇到資訊冗雜、搜尋結果不精確等問題,從而需要花費大量時間反覆搜尋、反覆收集,而應用盤古時尚多模態大模型後,設計師僅需輸入目標款式的對應文字描述,如“條紋開衫”,就可以快速獲得與文字描述相匹配的服裝圖片,縮短創作構思過程。不僅如此,盤古多模態大模型經過一系列量化等工程最佳化方案,還能夠有效降低模型推理視訊記憶體佔用量,從而提升單次推理生成的圖片數量,當前可支撐“一站式”批次呈現128張推理生成的服飾圖片。

最後,是

具備分鐘級設計推理能力。

面向億級資料的訓練,假設僅僅利用單節點8卡V100來訓練盤古大模型,耗費的時間往往需要以年計算。為了應對並行處理海量資料的挑戰、提高模型預訓練的效率,盤古團隊融合了多個先進的最佳化策略,如模型並行、資料並行、混合精度運算、稀疏訓練等。同時,基於華為雲高效的節點並行排程演算法,盤古多模態大模型最終能夠以天級為單位訓練完成,而盤古時尚多模態大模型,更利用了Attention Cache等技術加快推理速度,在華為雲提供的單卡V100支援上,目前就實現了支撐分鐘級推理速度,由此大大提升了時尚設計師和服裝企業的設計開發效率。

據介紹,目前面向時尚行業的盤古多模態大模型已具備跨模態檢索、圖文生成、時裝輔助設計、文案生成等相關能力,並在多項資料集上實現領先效能,如在COCO以文搜圖的零樣本任務中,盤古多模態大模型就已經超過了業界標杆演算法CLIP、ALIGN,達到業界最佳精度。

在此基礎上,華為雲也正在將盤古多模態大模型介面開放給多家時尚設計公司呼叫,希望能更好的賦能時尚設計產業。例如,作為一家集數字創意與智慧互聯的新型科技公司,時諦智慧目前就正在基於盤古大模型的技術和時諦智慧的線上協同設計、實時渲染以及完整的產業鏈協同能力,讓服裝設計週期從三週縮短至3-5天,由此能夠更好地化解中國時尚設計產業中過去常常面臨的開發設計週期長、生產成本高等一系列的難題。

客觀地說,今天的中國已成為全球第二大消費市場、第一大貿易大國。以中國服裝市場為例,服裝市場在過去的幾十年中一直保持著兩位數的增長,如今更是已趕超美國成為全球最大的市場,規模近3000億美元。從這個角度來看,盤古時尚多模態大模型的“應運而生”,對於整個服裝產業和時尚設計領域無疑有著非常重要的意義。

一方面,時尚設計某種意義上也是一種新的生產力,隨著盤古時尚多模態大模型的“入場”,對於那些缺乏設計團隊的中小企業或者代工企業而言,將會提供一種強有力支撐,這是因為這些企業可以利用AI來創作生產所需的圖案紋樣,從而彌補設計團隊人力資源的不足,由此進一步強化中國服裝產業的市場競爭力;另一方面,它還能夠為更多的時尚設計師們提供源源不斷的創意和靈感,極大地提升中國時尚設計產業的的原創力和原創量,進而加快整個服裝和時尚設計產業的數字化轉型升級。

盤古大模型的“七十二變”

回頭來看,自今年4月份華為雲盤古系列超大規模預訓練模型釋出以來,就以超強的實力“震撼”了業界。盤古系列超大預訓練模型包括了中文語言(NLP)、視覺(CV)大模型,多模態大模型、科學計算大模型。這其中,盤古NLP大模型是業界首個千億級生成與理解中文NLP大模型;華為雲在視覺領域打造的包含超過30億引數的CV大模型,也在不斷突破行業的極限。

盤古大模型:以AI織新衣,傳遞科技溫度和創新速度

華為雲人工智慧領域首席科學家、國際歐亞科學院院士、IEEE Fellow田奇表示,下一階段,盤古研發團隊將繼續對盤古多模態大模型進行迭代演進,持續開發上游通用能力;同時也會將把大模型拓展到更多的行業領域,讓盤古多模態大模型演化成諸多盤古行業多模態大模型,從而加速盤古系列預訓練大模型的“上天”(通用能力打造)與“入地”(行業落地)步伐。

在“上天”方面,華為雲目前就正在針對盤古大模型的預訓練技術、大模型的微調技術以及大模型的應用技術,展開了持續的探索與創新。

一是,

在盤古大模型的預訓練技術領域

,華為雲的目標是希望能夠以更低的成本得到更大的模型,並且能夠快速地遷移到不同的行業,適配不同的語言。為此,在預訓練技術的結構、初始化和訓練方面盤古大模型也都展開了新的實踐。以結構環節為例,盤古大模型就基於同網路的多模型融合技術,以更少的GPU卡,更少的訓練時間,來訓練更大更優的模型;初始化環節方面,華為雲透過自適應網路引數遷移等創新方案,也大幅度降低了模型的訓練難度,提升了訓練的速度;在訓練環節,華為雲也正透過模型融合技術、領域融合技術以及跨語言對映技術等,實現了更快更穩地訓練。

二是,

在盤古大模型的微調技術領域

,華為雲的目標是希望在大模型的基礎上,用更少的樣本、更短的選擇時間來得到更好的微調的結果。為此,華為雲透過多工微調技術、知識積累技術、零樣本推理技術等,有效地降低了微調過程中所需要的樣本訓練數量和訓練時間。此外,在模型引數微調方面,華為雲也正透過資料降本、樣本主動標註、樣本能力挖掘等技術,實現微調方面的改進和最佳化。

三是,

在盤古大模型的應用技術領域

,華為雲重點關注生成、搜尋、翻譯等領域的技術創新。以“生成”為例,華為雲希望透過大模型助力文學的創作、對話、問答;“搜尋”方面,華為雲的目標是讓盤古大模型能夠更好地支撐文字、圖片、影片、音訊等不同模態的搜尋,在搜尋領域更好的發揮出大模型的價值;而“在翻譯”方面,華為雲主要基於不同語言的大模型來支援多種語言之間的相互翻譯等等。

“入地”方面,盤古大模型同樣也成為了整個AI產業發展的關鍵底座,正在千行百業中發揮越來越重要的價值,除了上文中提到的時尚設計產業,華為雲盤古大模型還在超過100個實際場景中取得應用,覆蓋金融、醫療、工業、氣象、電力、零售、政務等多個領域。

比如,盤古CV大模型目前已經在醫學影像、金融、工業質檢等100餘項實際任務中得到了驗證,平均縮短開發時間80%以上,極大地提升了開發效率以及模型效能。再比如,盤古NLP大模型具備廣泛的運用場景,在金融領域,可以輔助識別企業風險,助力企業盡調和專案稽核。

在製藥行業,盤古大模型還學習了17億個藥物小分子的化學結構。因此,在藥物生成方面,就能夠對小分子化合物的獨特資訊的深度表徵、對靶點蛋白質的計算與匹配,以及對新分子生化屬性的預測,從而高效生成藥物新分子;在藥物最佳化方面,盤古大模型也可以對藥物的藥性進行判斷,如針對毒性、溶解性、蛋白質靶點的預測,由此實現了對篩選後的先導藥進行定向最佳化等等。

而展望未來,除了賦能千行百業之外,華為雲也正在聯合更多的行業夥伴構建全新的行業生態,在標準制定、中小微企業模型算力方面持續努力,讓盤古大模型實現更快的落地和紮根,最終透過降低AI開發和使用門檻,更好地推動人工智慧規模化的商用,由此開啟AI的千億、萬億市場,將人工智慧帶入全新的時代。

全文總結,在大涼山深處,孩子們穿上了華為雲盤古大模型“編織”的新年新衣,感受到了AI帶來的溫度;而越來越多的企業和行業,也正在藉助華為雲盤古大模型的“七十二變”能力,感受到了AI帶來的創新速度和高度,相信在不久的將來,華為雲盤古大模型也必將開啟新一輪的AI應用浪潮,在千行百業中爆發出更多的價值。