講座編號:jz-yjsb-2021-y036
講座題目:中國計算機(jī)學(xué)會計算機(jī)視覺專委會走進(jìn)高校系列報告會
主 講 人:查紅彬 教授 北京大學(xué)
趙 耀 教授 北京交通大學(xué)
紀(jì)榮嶸 教授 廈門大學(xué)
張 磊 教授 重慶大學(xué)
講座時間:2021年9月27日(星期一)下午14:00
講座地點(diǎn):北京工商大學(xué)阜成路校區(qū)西區(qū)綜合樓一層報告廳
參加對象:視覺領(lǐng)域?qū)I(yè)人士、研究生、媒體、其他有興趣者
主辦單位:計算機(jī)學(xué)院、研究生院
主講人簡介:
查紅彬,北京大學(xué)信息科學(xué)技術(shù)學(xué)院智能科學(xué)系教授,機(jī)器感知與智能教育部重點(diǎn)實(shí)驗(yàn)室主任。主要從事計算機(jī)視覺與智能人機(jī)交互的研究,在三維視覺幾何計算、三維重建與環(huán)境幾何建模、三維物體識別等方面取得了一系列成果。出版學(xué)術(shù)期刊及國際會議論文300多篇,其中包括IEEE T- PAMI,IJCV,IEEE T-VCG,IEEE T-RA,IEEE T-SMC,ACM T-IST,JMLR,PR 等國際期刊以及ICCV,ECCV,CVPR,CHI,ICML,AAAI,ICRA等國際學(xué)術(shù)會議論文100多篇。
趙耀,長江學(xué)者特聘教授、國家杰出青年科學(xué)基金獲得者、萬人計劃科技創(chuàng)新領(lǐng)軍人才、科技部重點(diǎn)領(lǐng)域創(chuàng)新團(tuán)隊帶頭人。現(xiàn)任北京交通大學(xué)信息科學(xué)研究所所長,“現(xiàn)代信息科學(xué)與網(wǎng)絡(luò)技術(shù)”北京市重點(diǎn)實(shí)驗(yàn)室主任。研究領(lǐng)域?yàn)閿?shù)字媒體信息處理與智能分析,包括圖像\視頻壓縮,數(shù)媒體內(nèi)容安全,媒體內(nèi)容分析與理解,人工智能等。主持了973計劃、863計劃等課題30余項(xiàng)。在包括IEEE Trans.等國內(nèi)外期刊、會議上發(fā)表論文200余篇。作為第一完成人獲北京市科學(xué)技術(shù)獎一等獎等省部級獎勵4項(xiàng)。指導(dǎo)的博士生7人獲北京市和中國計算機(jī)學(xué)會優(yōu)秀博士論文獎。受邀擔(dān)任了 IEEE Transactions on Cybernetics等多個國際雜志編委。他是國務(wù)院學(xué)科評議組成員,享受國務(wù)院政府特殊津貼。
紀(jì)榮嶸,廈門大學(xué)南強(qiáng)特聘教授,國家杰出青年科學(xué)基金獲得者。主要研究方向?yàn)橛嬎銠C(jī)視覺。近年來發(fā)表TPAMI、IJCV、ACM匯刊、IEEE匯刊、CVPR、NeurIPS等會議長?過百篇。論文谷歌學(xué)術(shù)引用萬余次。曾獲2016年教育部技術(shù)發(fā)明一等獎、2018年省科技進(jìn)步一等獎、2019年福建省青年科技獎。曾/現(xiàn)主持國防973項(xiàng)目,國家自然科學(xué)基金聯(lián)合重點(diǎn)基金等項(xiàng)目。任中國計算機(jī)學(xué)會A類國際會議CVPR和ACM Multimedia領(lǐng)域主席、中國圖象圖形學(xué)學(xué)會學(xué)術(shù)工委副主任、教育部電子信息類教指委人工智能專業(yè)建設(shè)咨詢委員會委員。
張磊,重慶大學(xué)教授,博士生導(dǎo)師,重慶市生物感知與智能信息處理重點(diǎn)實(shí)驗(yàn)室副主任,LiVE視覺智能與學(xué)習(xí)團(tuán)隊負(fù)責(zé)人,重慶市高層次人才計劃入選者、重慶市杰出青年基金獲得者、IEEE高級會員。主要聚焦于遷移學(xué)習(xí)、深度學(xué)習(xí)、開放環(huán)境視覺感知、跨媒體分析等領(lǐng)域。共發(fā)表論文100余篇,其中IEEE Trans.匯刊以及CCF-A類會議論文50余篇。多篇論文入選ESI高被引論文,出版英文專著1部,發(fā)明專利14項(xiàng)。擔(dān)任多個SCI期刊包括IEEE Trans. Instrumentation and Measurement以及Neural Networks等期刊Associate Editor,The Visual Computer以及Frontiers in Neurorobotics期刊客座編委,以及ACM MM、AAAI、CVPR、ICCV、ICLR等會議的AC、SPC和PC等。以第1完成人先后獲得吳文俊人工智能自然科學(xué)獎、重慶市科學(xué)技術(shù)獎、重慶市十佳科技青年獎3項(xiàng)。
主講內(nèi)容:
視覺SLAM:在線學(xué)習(xí)的途徑:3D視覺的一個主要任務(wù)是利用傳感器視點(diǎn)的變化與成像幾何的約束來實(shí)現(xiàn)三維場景的幾何與結(jié)構(gòu)重建。因此,伴隨傳感器移動的動態(tài)視覺與3D視覺的關(guān)系愈加密切,SLAM(Simultaneous Localization and Mapping:即時定位與地圖構(gòu)建)技術(shù)再度成為3D視覺領(lǐng)域的研究熱點(diǎn)。為了提高動態(tài)視覺系統(tǒng)在真實(shí)復(fù)雜場景中的應(yīng)用能力,我們應(yīng)充分強(qiáng)化視覺系統(tǒng)的環(huán)境自適應(yīng)性,而在線學(xué)習(xí)方法是實(shí)現(xiàn)這一目標(biāo)的有效途徑。該報告將圍繞基于在線學(xué)習(xí)的SLAM問題,介紹我們近來的一些想法和嘗試,主要內(nèi)容包括:面向自監(jiān)督視覺里程計的序列對抗學(xué)習(xí)方法;具有在線自適應(yīng)能力的自監(jiān)督SLAM學(xué)習(xí)。
弱監(jiān)督與交互式圖像分割:圖像語義分割,是涉及計算機(jī)視覺、模式識別及人工智能的交叉研究方向,是實(shí)現(xiàn)自動駕駛、智能監(jiān)控、虛擬現(xiàn)實(shí)、醫(yī)學(xué)圖像診斷、機(jī)器人等國家重點(diǎn)應(yīng)用的關(guān)鍵科學(xué)問題。目前,深度學(xué)習(xí)已經(jīng)在圖像語義分割領(lǐng)域取得了巨大突破。然而,大量的像素級標(biāo)注通常需要消耗大量的時間、金錢和人力。因此,訓(xùn)練數(shù)據(jù)的不足或缺失已經(jīng)成為制約圖像語義分割進(jìn)一步發(fā)展的關(guān)鍵因素之一。為減少像素級標(biāo)注的巨大負(fù)擔(dān),近年來提出了許多弱監(jiān)督圖像語義分割技術(shù),即利用大量容易獲取的弱監(jiān)督信息(如:圖像標(biāo)簽)來完成更加復(fù)雜的圖像語義分割任務(wù)。交互式語義分割是通過人機(jī)的簡單交互,引導(dǎo)計算機(jī)實(shí)現(xiàn)快速準(zhǔn)確的物體分割,是減輕像素級標(biāo)注成本的重要技術(shù)手段。本報告將重點(diǎn)介紹課題組在基于深度學(xué)習(xí)的圖像弱監(jiān)督語義分割以及交互式分割方面的部分研究成果。
復(fù)雜跨媒體數(shù)據(jù)協(xié)同分析與應(yīng)用:社交媒體包含了海量非合作、異構(gòu)化、跨模態(tài)的數(shù)據(jù),既蘊(yùn)藏了大量的人類知識與高價值信息,也包含了各種自然與人為的噪聲,對其分析與處理需要融合類腦計算、計算機(jī)視覺、自然語言處理等多個維度的智能技術(shù)。本報告主要關(guān)注基于深度學(xué)習(xí)的多模態(tài)內(nèi)容協(xié)同分析與表示、跨模態(tài)信息融合及智能對抗攻防,介紹課題組在圖像描述與視覺問答、語言指導(dǎo)的目標(biāo)檢測與分割、用戶隱私保護(hù)、社交網(wǎng)絡(luò)分析引導(dǎo)等方面的一些研究進(jìn)展。
開放環(huán)境視覺感知:在實(shí)際應(yīng)用中,由于數(shù)據(jù)不確定性、環(huán)境不可控性以及算法特異性,機(jī)器學(xué)習(xí)算法的適應(yīng)性和安全性依然較差,傳統(tǒng)的人工智能模型與深度學(xué)習(xí)算法難以滿足開放、動態(tài)、復(fù)雜環(huán)境下的感知與應(yīng)用。本報告圍繞遷移自適應(yīng)學(xué)習(xí)方法論以及視覺感知算法偏見問題,介紹我們近期在開放環(huán)境下的視覺感知研究進(jìn)展,包括圖像分類和目標(biāo)檢測等去偏方法。
