移動端


當(dāng)前位置:興旺寶>資訊首頁> 技術(shù)前沿

科學(xué)島團(tuán)隊提出一種跨模態(tài)機(jī)器視覺人工智能模型實現(xiàn)跨模態(tài)圖像檢索技術(shù)

2024-09-11 08:30:47來源:合肥物質(zhì)科學(xué)研究院 作者:高皖 閱讀量:139 評論

分享:

導(dǎo)讀:近日,中國科學(xué)院合肥物質(zhì)院智能所先進(jìn)制造中心王紅強(qiáng)研究員團(tuán)隊提出一種寬域跨模態(tài)機(jī)器視覺AI模型,突破了傳統(tǒng)單域模型跨模態(tài)信息處理瓶頸,實現(xiàn)了跨模態(tài)圖像檢索技術(shù)新突破。

  近日,中國科學(xué)院合肥物質(zhì)院智能所先進(jìn)制造中心王紅強(qiáng)研究員團(tuán)隊提出一種寬域跨模態(tài)機(jī)器視覺AI模型,突破了傳統(tǒng)單域模型跨模態(tài)信息處理瓶頸,實現(xiàn)了跨模態(tài)圖像檢索技術(shù)新突破。該研究成果被計算機(jī)視覺頂會(歐洲計算機(jī)視覺大會,ECCV2024)正式接收。
 
  跨模態(tài)機(jī)器視覺研究是當(dāng)前人工智能研究的前沿領(lǐng)域與主要挑戰(zhàn)之一,難點在于如何識別模態(tài)間的一致性和互補性。傳統(tǒng)方法通常在圖水平和特征水平上進(jìn)行,往往受限于信息粒度過大和圖像資源稀缺等問題??蒲袌F(tuán)隊發(fā)現(xiàn),相比圖和特征,細(xì)節(jié)關(guān)聯(lián)在多數(shù)情況下更好地保持了跨模態(tài)間的不變性。
 
  為此,科研團(tuán)隊提出了一種寬域信息挖掘神經(jīng)網(wǎng)絡(luò)(WRIM-Net),通過構(gòu)建全域交互學(xué)習(xí)機(jī)制實現(xiàn)了在空間域、通道域以及尺度域等多域中的細(xì)節(jié)關(guān)聯(lián)挖掘,突破了傳統(tǒng)單域模型的局限性。此外,通過設(shè)計跨模態(tài)關(guān)鍵實例對比學(xué)習(xí)模塊有效引導(dǎo)了網(wǎng)絡(luò)提取模態(tài)關(guān)聯(lián)信息。在驗證實驗中,不僅在標(biāo)準(zhǔn)SYSU-MM01和RegDB數(shù)據(jù)集上,還在最新的大規(guī)模跨模態(tài)LLCM數(shù)據(jù)集上證實了所提出模型的有效性,多項關(guān)鍵性能指標(biāo)首次突破90%,比如在SYSU-MM01上R1指標(biāo)達(dá)92.1%,在RegDB上mAP指標(biāo)達(dá)90.5%,接近實際應(yīng)用水平。該模型可用于視覺追溯與檢索、多模態(tài)大模型、醫(yī)學(xué)影像分析、安防監(jiān)控等多個人工智能應(yīng)用領(lǐng)域。
 
  博士生吳勇敢為文章的第一作者,王紅強(qiáng)為通信作者。該研究工作得到了國家自然科學(xué)基金項目、中國科學(xué)院設(shè)備開發(fā)、安徽省重點研究與開發(fā)計劃等科研項目的支持。
 
  據(jù)悉,歐洲計算機(jī)視覺大會(ECCV)是計算機(jī)視覺領(lǐng)域的頂尖國際學(xué)術(shù)盛會之一,與ICCV和CVPR并列“三大頂會”。自1986年起,ECCV每兩年舉行一次,聚焦計算機(jī)視覺的全方位研究,包括圖像與視頻的處理、分析和理解,及其在機(jī)器學(xué)習(xí)、模式識別、機(jī)器人、醫(yī)學(xué)影像、AR/VR等領(lǐng)域的應(yīng)用。
 
跨模態(tài)信息關(guān)聯(lián)性與寬域信息挖掘模型原理
版權(quán)與免責(zé)聲明:1.凡本網(wǎng)注明“來源:興旺寶裝備總站”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-興旺寶合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:興旺寶裝備總站”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。 2.本網(wǎng)轉(zhuǎn)載并注明自其它來源(非興旺寶裝備總站)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。 3.如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
我來評論

昵稱 驗證碼

文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)

    相關(guān)新聞