老司机精品一区在线视频,精品无码久久久久久久四虎,亚洲国产精品综合久久一线,亚洲AV无码精品无码久久蜜桃,午夜精品福利影院,毛片久久久,国产成人综合久久精品下载,亚洲自拍另类
ENGLISH 中文(簡體)
設為首頁 加入收藏
新聞中心
 
 當前位置: 首頁 > 新聞中心 > 行業快訊 > 【行業資訊】中科院自動化所基于MindSpore推出全球首個三模態預訓練模型
【行業資訊】中科院自動化所基于MindSpore推出全球首個三模態預訓練模型

日前,中國科學院自動化所(簡稱“自動化所”)基于全場景AI計算框架MindSpore訓練完成全球首個圖文音(視覺-文本-語音)三模態預訓練模型(OPT-Omni-Perception pre-Trainer),該模型同時具備跨模態理解與跨模態生成能力,標志著預訓練模型工作獲得突破性進展。

自GPT/Bert模型提出后,預訓練模型迎來了爆發式發展,其具有在無監督情況下自動學習不同任務、并快速遷移到不同領域數據的強大能力,而多模態預訓練模型被廣泛認為是從限定領域的弱人工智能邁向通用人工智能的路徑探索。然而,互聯網音視頻數據呈高速增長,占比超過80%,純文本的預訓練模型只涵蓋了互聯網數據中的較少部分,更豐富的語音、圖像、視頻等數據并未被充分利用與學習,且人類的信息獲取、環境感知、知識學習與表達,都是通過多模態信息方式來執行的。OpenAI 聯合創始人、首席科學家 Ilya Sutskever 在推特上發文表示,“人工智能的長期目標是構建多模態神經網絡,即AI能夠學習不同模態之間的概念,從而更好地理解世界”。為實現更加通用的人工智能模型,預訓練模型必然由單模態往多模態方向發展,將文本、語音、圖像、視頻等多模態內容聯合起來進行學習。自動化所瞄準這一方向,成功構建視覺-文本-語音三模態預訓練模型。

目前已有的多模態預訓練模型通常僅考慮兩個模態(如圖像和文本,或者視頻和文本),忽視了周圍環境中普遍存在的語音信息,并且模型極少兼具理解與生成能力,難以在生成任務與理解類任務中同時取得良好表現。針對這些問題,自動化此次提出的視覺-文本-語音三模態預訓練模型采用分別基于詞條級別(Token-level)、模態級別(Modality-level)以及樣本級別(Sample-level)的多層次、多任務子監督學習框架,更關注圖-文-音三模態數據之間的關聯特性以及跨模態轉換問題,對更廣泛、更多樣的下游任務提供模型基礎支撐。該模型不僅可實現跨模態理解(比如圖像識別、語音識別等任務),也能完成跨模態生成(比如從文本生成圖像、從圖像生成文本、語音生成圖像等任務)。靈活的自監督學習框架可同時支持三種或任兩種模態弱關聯數據進行預訓練,有效降低了多模態數據收集與清洗成本。

三模態預訓練模型基本原理

自動化所首次提出了視覺-文本-語音三模態預訓練模型,實現了三模態間相互轉換和生成。其核心原理是視覺、文本、語音不同模態通過各自編碼器映射到統一語義空間,然后通過多頭自注意力機制(Multi-head Self-attention)學習模態之間的語義關聯以及特征對齊,形成多模態統一知識表示,再利用編碼后的多模態特征,然后通過多頭自注意力機制進行通過解碼器分別生成文本、圖像和語音。這里三模態互相轉化和相互生成示意如圖1所示:

圖文音三模態相互轉換與生成

多層次多任務自監督預訓練學習

自動化提出的三模態預訓練模型由單模態編碼器、跨模態編碼器和跨模態解碼器構成。針對圖文音三模態數據,我們提出三級預訓練自監督學習方式:詞條級別 (Token-level,Modality-level),模態級(Modality-level masking)以及樣本級別(Sample-level masking) 。具體包括:

(1)詞條級別(Token-level)學習:(a)文本掩碼建模(Masked Language Modeling):隨機掩蓋一些文本單詞,需要模型根據上下文預測被掩蓋的單詞是什么;(b)視覺掩碼建模(Masked Vision Modeling):隨機掩蓋一些圖像區域,讓模型預測被掩蓋的區域;(c)語音掩碼建模(Masked Audio Modeling):隨機掩蓋一些語音詞條(token),模型需要預測被掩蓋的詞條(token)是什么。

(2)模態級別(Modality-level)學習:包括文本重構和圖像重構兩個任務,分別學習重構輸入文本和圖像。團隊引入模態級別掩碼(Modality-Level Masking)機制隨機地掩蓋一個模態信息,使得模型需要根據其他模態信息對當前模態進行重構,從而能夠進行下游的跨模態生成任務。這個機制也帶來另一個好處—它使模型不僅能夠處理三模態輸入,也能處理兩模態輸入,從而適應下游的兩模態任務。

(3)樣本級別(Sample-level)學習:該預訓練任務是通過對每個樣本隨機地替換三種模態信息中的一種或兩種,讓模型來預測替換哪些模態。

多維度自動混合并行極簡訓練

訓練多模態大模型,用戶需綜合考慮模型參數量、計算量、計算類型、集群帶寬拓撲和樣本數量等才能設計出性能較優的并行切分策略,在考慮模型編碼算法以外,還需要編寫大量并行切分和通信代碼。

MindSpore是業界首個支持全自動并行的AI計算框架,從如下維度進行多模態模型的加速訓練。(1)MindSpore同時使用數據并行、算子級模型并行、Pipeline模型并行、優化器模型并行、異構并行、重計算、高效內存復用多維度、全種類的分布式并行策略;(2)依托多種類、多維度的并行策略,原創集群拓撲感知的多維度自動混合并行,實現超大模型自動切分,取得了比人工編寫切分策略更優的結果,顯著提升集群加速能力;(3)基于多維混合自動并行技術,原創新的DNN分布式并行編程范式,實現一行代碼完成串行算法到并行算法的切換,使得開發者可以專注算法的研究;

基于上述優勢,MindSpore為復雜的多模態大模型提供了極好的訓練加速能力,同時也極大減少了系統性能優化的代價,大大縮短了代碼開發、調試和訓練的周期。

實驗結果

自動化所主要采用Open Images數據集作為預訓練數據,該數據包含圖像、文本與音頻數據。此外我們也額外地使用兩模態數據,如Conceptual Caption圖文數據集,Visual Genome圖文數據集等。當加入額外的兩模態數據時,這些兩模態與三模態數據則被隨機混合進行訓練。

自動化所主要進行了以下兩方面的實驗驗證:

(1)圖文音三模態關聯編碼與相互生成性能:分別在多模態融合的圖像分類、任意兩模態的相互檢索以及語音識別任務中,與常規全監督方法進行了性能比較,均取得了性能上的顯著提升。其中在多模態融合的圖像分類任務中,與常規全監督的Resnet101網絡模型相比,性能提升5%;加入語音模態信息能夠明顯提升以文搜圖的性能,驗證了聯合建模視覺-文本-語音三模態信息的必要性。

(2)多模態下游任務性能:分別在跨模態檢索、視覺問答與圖像語義描述任務中,與

當前最新的圖文兩模態預訓練模型進行了性能比較,在補充了圖文兩模態數據參與預訓練的模型上,取得了具有競爭力甚至更好的實驗性能。

以圖生音示例(短視頻)

以音生圖示例(短視頻)

總結

三模態預訓練模型的提出將改變當前單一模型對應單一任務的人工智研發范式,三模態圖文音的統一語義表達將大幅提升文本、語音、圖像和視頻等領域的基礎任務性能,并在多模態內容的理解、搜索、推薦和問答,語音識別和合成,人機交互和無人駕駛等商業應用中具有潛力巨大的市場價值。

“大數據+大模型+多模態”多任務統一學習將引領就技術發展的潮流,中科院自動化所所長徐波將在2021世界人工智能大會(WAIC)昇騰人工智能高峰論壇上介紹跨模態通用人工智能平臺,更多信息敬請關注。


文章來源:科學放大鏡


上海貿發展覽服務有限公司 深圳貿發會展服務有限公司
深圳市寶安區福海街道新和社區寶安大道6093號中正財富大廈311室
本站內容歸 ?上海貿發會展服務有限公司 ?版權所有
滬ICP備17023807號-16

電話:張先生 18621271618(同微信)
傳真:021-37048779
 
主站蜘蛛池模板: 亚洲日韩精品无码专区97| 日韩中文字幕免费在线观看| 成人久久18免费网站| 国产色图在线观看| 亚洲色图在线观看| 国产本道久久一区二区三区| 成人欧美日韩| 国产91在线免费视频| 国产精品人成在线播放| 国产亚洲精品自在久久不卡| 亚亚洲乱码一二三四区| 亚洲av无码人妻| 国产美女在线观看| 理论片一区| 国产综合精品日本亚洲777| 青青草国产一区二区三区| 欧美一区精品| 亚洲AⅤ波多系列中文字幕| 亚洲女同一区二区| 国产最新无码专区在线| 亚洲精品国偷自产在线91正片| 国产精品久久久久久久久久98 | 日韩精品一区二区三区免费| 国产九九精品视频| 亚洲欧美成人在线视频| 欧美三级自拍| 男人天堂伊人网| 国产精品女同一区三区五区| 婷婷色一区二区三区| 国产欧美视频在线观看| 高清无码不卡视频| 久久6免费视频| 小说 亚洲 无码 精品| 久久国产拍爱| 玖玖精品视频在线观看| 91九色国产在线| 亚洲中文字幕久久无码精品A| 久视频免费精品6| 情侣午夜国产在线一区无码| 亚洲色图狠狠干| 欧美综合一区二区三区| 国产精欧美一区二区三区| 亚洲成a人片| 91在线日韩在线播放| 国产毛片基地| 97视频精品全国免费观看| 蜜臀AV在线播放| 午夜三级在线| 99久久精彩视频| 国产高清无码麻豆精品| 欧美成人第一页| 欧美高清三区| 免费看a级毛片| 国产成在线观看免费视频| 亚洲天堂日本| 色欲国产一区二区日韩欧美| 亚洲国产欧美国产综合久久 | 四虎影视8848永久精品| 国模粉嫩小泬视频在线观看| 成人小视频网| 国产91小视频| 在线精品亚洲国产| 日韩AV手机在线观看蜜芽| 国产精品美女网站| 久久综合九色综合97婷婷| 波多野结衣亚洲一区| 国产男人的天堂| 欧美激情首页| 91午夜福利在线观看| 国产精品对白刺激| 亚洲欧洲日韩综合| 亚洲精品国产精品乱码不卞| 天天做天天爱夜夜爽毛片毛片| 妇女自拍偷自拍亚洲精品| 成年A级毛片| 国产日产欧美精品| 最新国产在线| 日本日韩欧美| 久久精品视频一| 日本人又色又爽的视频| 亚洲精品日产AⅤ| 亚洲a免费|