模式識別國家重點實驗室:一本正經(jīng)看“臉”的地方

發(fā)布時間:2019.05.08 瀏覽次數(shù):

模式識別國家重點實驗室的研究者們在認(rèn)真研究模式識別的機理,力圖讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻等。經(jīng)濟(jì)日報記者 沈 慧攝

 

模式識別國家重點實驗室以模式識別基礎(chǔ)理論、圖像處理與計算機視覺以及語音語言信息處理為主要研究方向,為開發(fā)智能系統(tǒng)提供關(guān)鍵技術(shù),科研成果大量應(yīng)用于國防建設(shè)、社會安全保障和國民經(jīng)濟(jì)發(fā)展領(lǐng)域

 

打開天天P圖,選擇“變臉”之如花美眷模式,來張自拍,原本有些“樸素”的面孔瞬間“美若天仙”——這種看起來不可思議的“魔法”,其背后是人臉檢測和人臉配準(zhǔn)技術(shù)的應(yīng)用,而這只是中國科學(xué)院自動化研究所模式識別國家重點實驗室頗具代表性的研究成果之一。

 

眼睛的“臉”、步態(tài)的“臉”、聲音的“臉”、大腦的“臉”……模式識別國家重點實驗室是一個一本正經(jīng)看“臉”的地方。在這里,研究者們行走在電腦與人腦之間,專注研究各類“臉”,科研成果大量應(yīng)用于國防建設(shè)、社會安全保障和國民經(jīng)濟(jì)發(fā)展領(lǐng)域。

 

一個眼神“確定”你

 

北京北四環(huán),模式識別國家重點實驗室內(nèi),一臺白色機器前一位女士緩緩走來。機器發(fā)出悅耳的聲音:“請靠近。”女士聽從指令向前挪了挪,眼睛對準(zhǔn)機器。“王雅麗。”聲音再次響起,身份確認(rèn)完成。

 

這個鑒別身份的技術(shù)就是虹膜識別。虹膜是位于人眼表面黑色瞳孔和白色鞏膜之間的圓環(huán)狀薄膜,在近紅外光下呈現(xiàn)出豐富的視覺紋理特征,如斑點、條紋、細(xì)絲、冠狀、隱窩等。“虹膜是唯一、穩(wěn)定、安全的人體生物特征,在常見的生物特征模態(tài)中身份識別精度最高、比對速度最快、安全防偽最強,適合于大規(guī)模人群的身份認(rèn)證應(yīng)用。”中科院自動化所工程師黃晨告訴經(jīng)濟(jì)日報記者。

 

據(jù)介紹,傷痕、干燥、油膩、污漬等,都會影響指紋識別的效果;人臉識別則容易受到光線、年齡、膚色、姿態(tài)、表情、妝容等多種因素的影響。

 

虹膜識別要實現(xiàn)應(yīng)用并非易事。虹膜圖像獲取是虹膜識別的第一個關(guān)鍵步驟。中國科學(xué)院院士譚鐵牛回憶說,上世紀(jì)90年代末我國虹膜識別研究剛剛起步,那時國外不僅不提供用于算法研究的數(shù)據(jù)庫,就連虹膜采集設(shè)備也不賣。

 

實驗室從零開始,通過自主創(chuàng)新,打破國際上的虹膜識別技術(shù)壟斷,完成了從跟跑者到領(lǐng)跑者角色的轉(zhuǎn)變。如今,在虹膜圖像獲取方面,實驗室實現(xiàn)了從單目到雙目、由近及遠(yuǎn)以及從固定到移動狀態(tài)的圖像獲取。與此同時,團(tuán)隊自主建設(shè)的CASIA虹膜圖像數(shù)據(jù)庫成為目前國際上使用最廣泛的虹膜圖像數(shù)據(jù)庫,有來自170多個國家和地區(qū)的3萬多個科研團(tuán)隊申請使用。

 

在完成基礎(chǔ)研究的同時,實驗室的虹膜識別技術(shù)也從實驗室走向了市場。去年,虹星科技有限公司研發(fā)的“駕駛員生物特征識別一體機”正式投產(chǎn),將虹膜識別距離從40厘米拓展到了1.2米,僅需兩秒鐘即可完成身份確認(rèn)。該設(shè)備的核心技術(shù)與團(tuán)隊正是來自模式識別國家重點實驗室。

 

“虹膜識別技術(shù)被普遍認(rèn)為是最具有發(fā)展前景的生物認(rèn)證技術(shù),具有高安全性,可用于安防、國防、電子商務(wù)等多個領(lǐng)域。目前,我國已形成以北京為主的虹膜研發(fā)和生產(chǎn)聚集地。”虹星科技有限公司創(chuàng)始人侯廣琦說。

 

一個步態(tài)“鎖定”你

 

與侯廣琦不同,模式識別國家重點實驗室副主任王亮這些年一直在跟蹤研究另一種生物特征識別——步態(tài)識別。

 

何謂步態(tài)識別?即根據(jù)一個人走路的姿態(tài)和人體信息進(jìn)行身份鑒定。“比如,你平日熟悉的朋友,有一天走在街上,只憑背影你就能知道是他。”王亮說,雖然相對于人臉識別,步態(tài)識別的準(zhǔn)確率還較低,影響識別效果的因素還很多,但在安防等一些特殊應(yīng)用領(lǐng)域,步態(tài)識別有遠(yuǎn)距離識別這一特定優(yōu)勢。

 

遠(yuǎn)距離識別能相隔多遠(yuǎn)?按照實驗室目前的水平,只看走路的姿態(tài),50米外,眨兩下眼睛的時間,攝像頭就可以準(zhǔn)確辨識出特定對象。“人臉識別準(zhǔn)確率雖高,但太遠(yuǎn)了看不清。虹膜識別的采集距離目前最遠(yuǎn)可以達(dá)到1.2米至1.8米。”王亮說。

 

步態(tài)識別以其遠(yuǎn)距離、難隱藏性、非接觸性和非侵入性等特點從眾多生物特征識別中脫穎而出,大量應(yīng)用于各個行業(yè)。以實驗室孵化的銀河水滴科技有限公司為例,一些石油企業(yè)開始引入其步態(tài)識別技術(shù)完善防控網(wǎng)絡(luò),防范非法闖入者對油田安全的威脅和對油田經(jīng)濟(jì)利益的損害;在智能家居領(lǐng)域,該公司的技術(shù)可以很好地區(qū)分用戶屬性,替代遙控器等傳統(tǒng)操作工具,讓家電感知更加智能化。

 

銀河水滴公司還與公安系統(tǒng)合作,首次利用步態(tài)識別技術(shù)搜索到犯罪嫌疑人?,F(xiàn)有的公安系統(tǒng)缺乏有效的視頻分析和檢索工具,平均每個現(xiàn)發(fā)案件需要人工審核數(shù)百甚至上千小時的視頻資料。利用步態(tài)識別技術(shù),對真實監(jiān)控攝像頭拍錄的數(shù)小時視頻進(jìn)行搜索比對,最終警方在近千人的目標(biāo)人群中成功確認(rèn)嫌疑人范圍,完成國內(nèi)首次步態(tài)識別辦案工作。

 

“不同人的運動神經(jīng)敏感度、肌肉力量特點、身體結(jié)構(gòu)不同,這決定了步態(tài)的唯一性和穩(wěn)定性,可以滿足特殊領(lǐng)域的應(yīng)用需求。”黃晨表示。

 

計算機學(xué)會決策

 

虹膜、人臉、指紋、掌紋、掌靜脈、筆跡、步態(tài)……事實上,各種生物特征識別只是模式識別國家重點實驗室眾多研究方向中的一個。

 

究竟什么是模式識別?模式識別是對表征物體或現(xiàn)象的各種形式數(shù)據(jù)(主要是感知數(shù)據(jù),如圖像、視頻、語音等)進(jìn)行處理和分析,進(jìn)而對物體或現(xiàn)象進(jìn)行描述、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。“通俗點說,就是讓計算機模擬人類去聽、去說、去看、去讀、去思考、去決策,讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻等。”王亮解釋說。

 

實驗室面向國家戰(zhàn)略需求和國際學(xué)科前沿,開展基礎(chǔ)性、前瞻性、戰(zhàn)略性和系統(tǒng)性的創(chuàng)新研究,已成為引領(lǐng)模式識別領(lǐng)域科學(xué)研究的重要基地。

 

實驗室研發(fā)的高性能機器翻譯系統(tǒng),率先實現(xiàn)了漢語和蒙藏維等少數(shù)民族語言之間的自動翻譯,翻譯的準(zhǔn)確率和速度均已達(dá)到國際先進(jìn)水平,該系統(tǒng)廣泛應(yīng)用于大型跨國公司、軍隊等部門,在保障國家信息安全方面發(fā)揮了重要作用。

 

針對各類文檔圖像,實驗室提出了有效的版面分析、文本行提取和識別方法,獲得了領(lǐng)先的性能,在金融和安全等領(lǐng)域?qū)崿F(xiàn)了規(guī)模化應(yīng)用。

 

實驗室研發(fā)的高性能多模態(tài)人機交互平臺,具有遠(yuǎn)場語音識別和情感識別能力,以及個性化的語音合成系統(tǒng),向眾多企業(yè)授權(quán)使用。

 

實驗室腦網(wǎng)絡(luò)組研究中心聯(lián)合陸軍總醫(yī)院和廣州總醫(yī)院組成聯(lián)合攻關(guān)團(tuán)隊,在基于“植物人”病因、年齡和病程作為重要預(yù)測指標(biāo)的基礎(chǔ)上,使用基于腦功能磁共振影像的患者腦功能網(wǎng)絡(luò)特征,結(jié)合機器學(xué)習(xí)相關(guān)算法,構(gòu)建了一個計算模型預(yù)測患者一年之后恢復(fù)意識的可能性,準(zhǔn)確率達(dá)到88%。

 

在研究計算機感知外部世界的同時,實驗室引入了腦連接信息對腦區(qū)進(jìn)行精細(xì)劃分,成功繪制出全新的人類腦圖譜:腦網(wǎng)絡(luò)組圖譜包括246個精細(xì)腦區(qū)和亞區(qū),比傳統(tǒng)的腦圖譜精細(xì)4至5倍,該項成果入選2016年“中國十大科技進(jìn)展”“中國十大醫(yī)學(xué)進(jìn)展”和改革開放40年中國科學(xué)院40項標(biāo)志性重大科技成果之一。

 

“以模式識別基礎(chǔ)理論、圖像處理與計算機視覺以及語音語言信息處理為主要研究方向,研究人類模式識別的機理以及有效的計算方法,為開發(fā)智能系統(tǒng)提供關(guān)鍵技術(shù),這是實驗室肩負(fù)的主要使命。”王亮說。