AI江湖風(fēng)起云涌,加之計算機視覺、自然語言處理等技術(shù)日趨成熟,使得打破語言與視覺之間的次元壁成為可能,文本與圖像互通的多模態(tài)模型成為AI大模型的熱點研究方向。

與BERT和GPT-3這兩個都是在純文本上進行訓(xùn)練并應(yīng)用于自然語言處理下游任務(wù)的基礎(chǔ)模型不同,在2021年3月、2021年6月以及2022年6月發(fā)布的文瀾模型是在成對的“圖像-文本”或者“視頻-文本”數(shù)據(jù)上訓(xùn)練得到,可以適應(yīng)一系列多模態(tài)、視覺和自然語言處理多種類別任務(wù)。這種多模態(tài)的學(xué)習(xí)方式與人類孩子成長的過程更加接近,是通過邊看邊聽來認識世界和學(xué)習(xí)語言的。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。!:首頁 > 新聞 » 多模態(tài)是構(gòu)建AI基礎(chǔ)模型的必由之路文瀾像孩子一樣感知世界