阿里巴巴(09988)旗下阿里雲今(7日)於上海2023世界人工智能大會(WAIC)上發布最新人工智能(AI)繪畫創作大模型「通義萬相」。這一款前沿生成式AI模型基於阿里雲「通義」大模型能力創建,是其家族新成員,支援「文生圖」功能,即用戶可以在該模型中輸入提示詞,以輸出相應圖像。「通義萬相」目前已經上線,正式向中國內地企業客戶及公眾開啟定向邀測。
阿里雲智能首席技術官(CTO)周靖人表示,「通義萬相」的發布將進一步令高質AI生成圖像於不同行業廣泛使用,協助電子商務、遊戲、設計和廣告等眾多領域的企業開展創新的AI藝術創作和創意表達。該模型代表集團在前沿生成式AI模型發展歷程上的又一重要里程碑,公司正不斷探索重塑行業發展範式的技術,以協助企業和社群釋放更大創造力及生產力。
據報,阿里雲使用其自研大模型Composer開發「通義萬相」,可更好地控制最終輸出圖像,如空間布局和調色板,同時確保圖像合成兼具品質和創意。「通義萬相」模型可根據文字內容生成多種風格的圖像,包括水彩、扁平插畫、二次元、油畫、中國畫、3D卡通和素描等。除文生圖外,「通義萬相」也推出風格遷移、相似圖生成等功能。
周靖人在大會上提到,實際上正從訊息時代真正進入智能時代,而其中一個重要環節就是模型變得無處不在,而模型所代表的知識體系,也變得讓大眾觸手可及。他指出,集團一直在探討如何在智能時代,把模型作為一個重要生產元素,重新去定義其開發範式,從去年阿里雲提出模型即服務(Model-as-a-Service,MaaS)之後不到一年間,該概念已經廣被外界接受。
阿里雲同時宣布推出通用框架ModelScopeGPT,是一款大小模型協同智能助手,旨在透過一套技術框架,協助用戶透過使用AI模型社區ModelScope(魔塔)平台上的多元AI模型能力,完成各類複雜度高和專業性強的AI任務,適用領域包括語言、視覺和語音等。ModelScopeGPT將使用語言大模型作為控制器,連接ModelScope開源社區中大量特定領域的專業模型。
阿里雲於去年推出開源模型即服務平台ModelScope,據周靖人稱,該社區目前已聚集了180多萬名AI開發者,有逾900個AI模型。他指出,集團的首要目標是促進中國大模型生態的繁榮,向大模型創業公司提供服務,包括智能算力和開發工具,並在資金和商業化探索方面提供支持,要將ModelScope社區培育成國內最大的「大模型自由市場」。