導(dǎo)語:
人類視覺系統(tǒng)(HVS)的研究發(fā)現(xiàn),人們在觀察視頻圖像時,習(xí)慣把大部分注意力集中在視覺聚焦點周圍的小范圍區(qū)域內(nèi),并賦予這個區(qū)域很高的分辨率,而聚焦點外的范圍則以較低分辨率呈現(xiàn),這種預(yù)測視覺關(guān)注區(qū)域的過程就叫顯著性檢測。北航國際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授的研究團(tuán)隊開展了視頻和圖像顯著性檢測模型的研究,成果現(xiàn)已發(fā)表至《IEEE Transactions on Image Processing》、《International Conference on Computer Vision (ICCV)》、《Computer Vision and Pattern Recognition (CVPR)》等國際重要期刊與會議上,并在多媒體通信領(lǐng)域內(nèi)引起廣泛好評。

研究背景:通信道路的“擁堵”
科研是為創(chuàng)造更好的未來,其靈感也源于現(xiàn)實生活的不足。通過智能終端欣賞視頻資源,已經(jīng)成為人們?nèi)粘I钪斜夭豢缮俚沫h(huán)節(jié)。用戶對獲取更高清視頻需求在日益增長,使得通信行業(yè)的熱點,聚焦在了如何實現(xiàn)海量高清音像視頻數(shù)據(jù)更高效地傳輸。
視頻通信領(lǐng)域的瓶頸在于隨著超高清視頻與全景視頻的發(fā)展,網(wǎng)絡(luò)需要傳輸?shù)臄?shù)據(jù)量在不斷膨脹,但是傳輸數(shù)據(jù)的帶寬卻是有限的。正如空間有限的公路上行駛的車越來越多,容易引發(fā)道路擁堵。當(dāng)下,有限帶寬下的視頻高效傳輸,已成為通信行業(yè)亟待解決的問題。
靈感來源:前沿?zé)狳c的融合
徐邁老師及其課題組的研究興趣為視頻通信與圖像處理,他們在研究壓縮編碼的過程中受人工智能和機(jī)器學(xué)習(xí)的啟發(fā),通過研究人類觀看視頻的用戶體驗,為視頻壓縮提供了新的解決思路。人類視網(wǎng)膜相當(dāng)于以億為單位像素級別的高清相機(jī),人在觀察視頻圖像時有一種聚焦“Attention(關(guān)注點)” 的機(jī)能,能夠發(fā)揮“刪繁就簡”的功能能力,對于呈現(xiàn)給視覺的場景,只有我們關(guān)注的地方會很清楚,而周圍則會出現(xiàn)相對模糊的情況。
受到啟發(fā)的徐邁老師及其課題組大膽提出假設(shè):如果為計算機(jī)賦予人的視覺機(jī)能,壓縮視頻數(shù)據(jù)時在人們視覺關(guān)注度高的區(qū)域分配更多的編碼資源,使得視頻壓縮后仍能夠達(dá)成人們視覺體驗上高質(zhì)量的效果,同時在周圍節(jié)省編碼資源。借鑒“Perceptual Video Coding(感知視頻編碼)”的“感知”技術(shù),徐老師推動這一新的研究方向:建立人在視頻圖像中的關(guān)注區(qū)域預(yù)測模型,以預(yù)測視頻圖片場景中的視覺關(guān)注集中域。
研究拓展:年輕團(tuán)隊的合作
為了探索出人類視覺關(guān)注區(qū)域的模型,徐邁老師帶領(lǐng)團(tuán)隊展開研究。團(tuán)隊中最小的成員為一名大三年級的本科生,徐老師說:“學(xué)生的興趣與個人能力,才是開展科學(xué)研究的關(guān)鍵因素”。因此在徐邁老師的團(tuán)隊中,學(xué)生年齡呈現(xiàn)年輕化的特點。
研究團(tuán)隊通力合作,從數(shù)據(jù)出發(fā),利用機(jī)器學(xué)習(xí)方法挖掘人體視覺認(rèn)知規(guī)律。團(tuán)隊邀請多位被試者走進(jìn)實驗室,記錄被試者觀看視頻時關(guān)注區(qū)域的結(jié)果數(shù)據(jù),以實際采集到的數(shù)據(jù)為驅(qū)動,運用支持向量機(jī)和深度學(xué)習(xí)方法建立機(jī)器學(xué)習(xí)模型,實現(xiàn)視頻關(guān)注區(qū)域的預(yù)測。
徐邁老師團(tuán)隊視頻顯著性檢測的研究成果,不但能應(yīng)用于視頻圖像壓縮,還能夠應(yīng)用于多種領(lǐng)域,如對網(wǎng)頁和展示排版設(shè)計領(lǐng)域提供指導(dǎo),通過合理安放圖標(biāo)、文字,調(diào)整配圖、配色,可以達(dá)到最大程度吸引視覺注意力的目標(biāo)。而徐邁老師團(tuán)隊的下一步研究重點,將嘗試拓展至具有“交互性、沉浸式”特點的全景視頻新鮮領(lǐng)域。團(tuán)隊也將商討與其他科研團(tuán)隊的合作方案,實現(xiàn)多學(xué)科之間相互交叉研究。
策劃/文案:秦煜瑤、張金星
外文編輯:劉昕睿
設(shè)計:秦煜瑤 技術(shù):曹嘉輝
鳴謝:國際交叉科學(xué)研究院、電子信息工程學(xué)院徐邁副教授
編審:門戶網(wǎng)站總編總監(jiān)工作室
投稿:geoos@buaa.edu.cn