必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

中國(guó)科學(xué)院自動(dòng)化所研究員王金橋:多模態(tài)大模型邁入主動(dòng)交互新時(shí)代丨2025移動(dòng)通信高質(zhì)量發(fā)展論壇

2025年11月22日 09:50CCTIME飛象網(wǎng)

11月21日,以“非凡‘十四五’ 聚力啟新程”為主題的2025移動(dòng)通信高質(zhì)量發(fā)展論壇在湖北武漢舉辦。中國(guó)科學(xué)院自動(dòng)化研究所副總工程師、武漢人工智能研究院院長(zhǎng)王金橋在論壇上作題為《多模態(tài)大模型:邁入主動(dòng)交互新時(shí)代》的主旨發(fā)言。

王金橋表示,多模態(tài)大模型已成為AI產(chǎn)業(yè)應(yīng)用的主要方向。從感知理解到生成創(chuàng)造,大模型技術(shù)成為通用智能技術(shù)的主流探索方向。當(dāng)前,大模型在“大算力、大數(shù)據(jù)、大參數(shù)”的驅(qū)動(dòng)下持續(xù)升級(jí)。然而,僅靠增大參數(shù)量帶來(lái)的性能提升已日漸平緩。因此,發(fā)展重點(diǎn)正從規(guī)模擴(kuò)張轉(zhuǎn)向智能體、合成數(shù)據(jù)和推理計(jì)算等新方向。這種計(jì)算范式的轉(zhuǎn)變,也導(dǎo)致了模型在推理和“思考”過(guò)程中的算力需求顯著增加。

王金橋介紹,人工智能的發(fā)展路徑是從生成式AI到AI智能體,再到物理交互的AI。在生成式AI階段,數(shù)據(jù)決定智能模型的高度;在AI智能體階段,記憶決定Agentic的應(yīng)用規(guī)模;在物理AI階段,環(huán)境決定模型自演進(jìn)。

對(duì)于中美兩國(guó)在人工智能上的差距,王金橋表示,中美兩國(guó)之間的差距快速縮小,在LMSYS聊天機(jī)器人競(jìng)技場(chǎng)中,2024年1月,美國(guó)頂級(jí)模型的表現(xiàn)比最佳中國(guó)模型高出9.26%;而到2025年2月,這一差距縮小至僅為1.7%。我國(guó)人工智能創(chuàng)新水平已經(jīng)進(jìn)入世界第一梯隊(duì),2020年,全球AI期刊論文中引用中國(guó)論文的比例達(dá)到20.7%,首次超過(guò)美國(guó)的19.8%。

王金橋表示,目前的差距主要體現(xiàn)在硬件、數(shù)據(jù)、技術(shù)和人才上。在硬件上,高端AI算力資源不足,同時(shí)也缺乏足夠的資金來(lái)支撐智算集群的高昂訓(xùn)練與運(yùn)營(yíng)成本;在數(shù)據(jù)上,中文高質(zhì)量數(shù)據(jù)資源小于英文,差距達(dá)到20-30倍,需要高質(zhì)量數(shù)據(jù)清洗;在技術(shù)上,通用基礎(chǔ)大模型開發(fā)是一個(gè)系統(tǒng)工程,需具備分布式訓(xùn)練、模型優(yōu)化等技術(shù)經(jīng)驗(yàn)與工程化能力;在人員上,把know-how數(shù)據(jù)轉(zhuǎn)化成Q&A的能力,需要大量的工程師。

2024年圖靈獎(jiǎng)得主、“強(qiáng)化學(xué)習(xí)之父”理查德·薩頓說(shuō)過(guò):“2024年人類數(shù)據(jù)正在迅速逼近極限,智能體將越來(lái)越多地通過(guò)與世界的交互來(lái)進(jìn)行學(xué)習(xí),潛力將遠(yuǎn)超以往。”

對(duì)此,王金橋表示,新一代人工智能研究體系已經(jīng)形成。AI基礎(chǔ)研究范式正從傳統(tǒng)數(shù)據(jù)智能向大數(shù)據(jù)智能、跨媒體智能、群體智能、混合增強(qiáng)智能、自主智能等人工智能五大形態(tài)轉(zhuǎn)變。新一代人工智能基礎(chǔ)研究框架推動(dòng)人工智能基礎(chǔ)理論創(chuàng)新,知識(shí)引導(dǎo)、視覺(jué)知識(shí)、群智涌現(xiàn)、混合增強(qiáng)智能等多學(xué)科交叉發(fā)展。

王金橋介紹了紫東太初多模態(tài)大模型的發(fā)展和應(yīng)用情況。紫東太初多模態(tài)大模型4.0現(xiàn)已具備多模態(tài)理解、文本數(shù)學(xué)、邏輯思維、視覺(jué)問(wèn)答、GUI智能體、工具調(diào)用六大能力,對(duì)標(biāo)GPT-4.1-nano、GPT-4o等先進(jìn)模型。在服務(wù)科學(xué)研究上,紫東太初多模態(tài)大模型打造了面向科研全流程的科學(xué)智能平臺(tái),可自主規(guī)劃及調(diào)用超過(guò)300個(gè)科學(xué)計(jì)算工具,實(shí)現(xiàn)工具的協(xié)同編排和便捷調(diào)用,可自動(dòng)識(shí)別科研任務(wù)、智能編排并調(diào)度最優(yōu)工具鏈,提升科研流程效率,支持用戶靈活接入自有智能體與工具,快速搭建專屬科研應(yīng)用。在服務(wù)千行百業(yè)上,基于多模態(tài)大模型構(gòu)建的長(zhǎng)江流域模擬器,可以實(shí)現(xiàn)對(duì)長(zhǎng)江流域綠色發(fā)展水平的評(píng)估,并對(duì)水生態(tài)、防洪、航運(yùn)、供水等進(jìn)行實(shí)時(shí)監(jiān)測(cè)預(yù)警。

編 輯:霏雯
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像