黃鐵軍,生于1970年12月,籍貫河北省邯鄲市,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、北京智源人工智能研究院院長(zhǎng)、國(guó)家人工智能標(biāo)準(zhǔn)化總體組副組長(zhǎng),主要研究方向?yàn)?a href="http://www.6663808.com/zixun/search.php?kw=智能" target="_blank">智能視覺(jué)信息處理與類腦智能。
愛(ài)國(guó)情 奮斗者
“剛開(kāi)完會(huì),上午會(huì)議結(jié)束得晚,咱們邊吃邊聊吧?!钡谝淮我?jiàn)到北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授黃鐵軍是在一次會(huì)議間隙,正值午飯時(shí)間,快人快語(yǔ)的他直接招呼記者一起用餐。
1970年,黃鐵軍生于河北省邯鄲市大名縣的一個(gè)普通村莊,和著名歌手鄧麗君是同鄉(xiāng)。若是身處在人群中,中等個(gè)子、衣著樸素的黃鐵軍,顯然不會(huì)像鄧麗君那樣引人注目。但在人工智能(AI)機(jī)器視覺(jué)領(lǐng)域,他有著絕對(duì)的發(fā)言權(quán)。
最近他的成果再次成為業(yè)界關(guān)注的焦點(diǎn)。前段時(shí)間,黃鐵軍牽頭研制的超速全時(shí)仿視網(wǎng)膜芯片首次公開(kāi)亮相。這款芯片采用光電技術(shù),能“看清”高速旋轉(zhuǎn)葉片上的文字,可充當(dāng)AI的“超速電眼”。
從農(nóng)村娃到如今的AI大咖,在黃鐵軍身上,有著怎樣的故事?
高中時(shí)對(duì)編程感興趣
1986年,黃鐵軍上高二。那時(shí)很多人還沒(méi)見(jiàn)過(guò)計(jì)算機(jī),他卻幸運(yùn)地就用上了電腦。
“當(dāng)時(shí)正值國(guó)家在中學(xué)推廣計(jì)算機(jī)學(xué)習(xí),一些電腦被下發(fā)到部分學(xué)校。我所在的高中就有5臺(tái)電腦,而后我參加了學(xué)校組織的計(jì)算機(jī)興趣班?!秉S鐵軍回憶道,自己對(duì)計(jì)算機(jī)“一見(jiàn)如故”,沒(méi)學(xué)多久就開(kāi)始自己上機(jī)編程。
因?yàn)樗绦蚓幍煤?,老師把一臺(tái)電腦撥給他專用。如今,黃鐵軍仍心存感激,高中時(shí)這段與計(jì)算機(jī)親密接觸的經(jīng)歷,為他日后的科研選擇埋下了伏筆。
1988年,臨近高考,那時(shí)的他一心想探求世界本源,于是毫不猶豫地填報(bào)了北京大學(xué)物理系。遺憾的是,他高考發(fā)揮失常,沒(méi)能進(jìn)入心儀的大學(xué)。正在猶豫是否復(fù)讀時(shí),他收到了武漢工業(yè)大學(xué)(現(xiàn)為武漢理工大學(xué))的補(bǔ)錄錄取通知書(shū),隨后進(jìn)入該校計(jì)算機(jī)學(xué)院應(yīng)用技術(shù)專業(yè)。
1995年,黃鐵軍進(jìn)入華中理工大學(xué)(現(xiàn)為華中科技大學(xué))圖像識(shí)別與人工智能研究所攻讀博士學(xué)位,主要研究方向?yàn)殡p目立體視覺(jué)及其在虛擬現(xiàn)實(shí)中的應(yīng)用。畢業(yè)后,1999年他進(jìn)入中國(guó)科學(xué)院計(jì)算技術(shù)研究所進(jìn)行博士后研究,研究方向?yàn)閳D像識(shí)別技術(shù),合作導(dǎo)師是時(shí)任所長(zhǎng)、現(xiàn)北京大學(xué)教授、中國(guó)工程院院士高文。
“逼上梁山”轉(zhuǎn)戰(zhàn)視頻編碼
從博士到博士后,黃鐵軍的研究都圍繞圖像識(shí)別展開(kāi)。當(dāng)時(shí),他以為自己會(huì)沿著這條路走下去,但命運(yùn)卻把他引向了一條岔路——視頻解碼。
2002年,數(shù)萬(wàn)臺(tái)我國(guó)制造出口的DVD,由于未支付專利許可費(fèi),在歐盟地區(qū)被海關(guān)扣押。在專利大棒的打壓下,集中在廣東地區(qū)的相關(guān)生產(chǎn)工廠大量倒閉。
“那是改革開(kāi)放后,我國(guó)首次遭遇重大知識(shí)產(chǎn)權(quán)問(wèn)題?!秉S鐵軍說(shuō),制定中國(guó)自主知識(shí)產(chǎn)權(quán)音視頻壓縮標(biāo)準(zhǔn),擺脫受制于人的困境,在當(dāng)時(shí)變得十分迫切。
彼時(shí),主題為“寬帶流媒體”的香山科學(xué)會(huì)議正在召開(kāi),大會(huì)主席安排黃鐵軍起草會(huì)議簡(jiǎn)報(bào)。會(huì)議期間,工信部、科技部相關(guān)領(lǐng)導(dǎo)明確要求成立數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組(AVS),解決音視頻產(chǎn)品的知識(shí)產(chǎn)權(quán)問(wèn)題,高文任組長(zhǎng)。
對(duì)黃鐵軍來(lái)說(shuō),視頻編碼是個(gè)“從未涉足過(guò)的領(lǐng)域”。但由于簡(jiǎn)報(bào)寫(xiě)得好,博士后剛出站的黃鐵軍就被任命為AVS秘書(shū)長(zhǎng)。他自嘲道,自己是“被逼上梁山”的秘書(shū)長(zhǎng)。
“既然是國(guó)家需要,自己接下了任務(wù),就得好好干?!秉S鐵軍說(shuō),此后他的研究重心逐漸向視頻編碼方向傾斜。
AVS工作組成立后,經(jīng)歷過(guò)一段艱難歲月。黃鐵軍說(shuō),2004年工作組制定的視頻編解碼技術(shù)標(biāo)準(zhǔn)送審,但直至兩年后才發(fā)布?!耙?yàn)楫a(chǎn)業(yè)化本身涉及芯片、軟件、產(chǎn)品設(shè)備和端到端系統(tǒng)等眾多關(guān)鍵環(huán)節(jié),只有研制出符合標(biāo)準(zhǔn)的芯片,標(biāo)準(zhǔn)才能通過(guò)。”他說(shuō)。
矛盾的是,如果標(biāo)準(zhǔn)不發(fā)布,企業(yè)就不愿研發(fā)芯片。無(wú)奈之下,工作組最終決定自己組織芯片設(shè)計(jì)團(tuán)隊(duì)。15年來(lái),這支團(tuán)隊(duì)伴隨著AVS標(biāo)準(zhǔn)制定,研發(fā)出了一系列視頻編碼芯片。
搞研究不走尋常路
參與AVS工作的同時(shí),黃鐵軍也開(kāi)始了從圖像識(shí)別轉(zhuǎn)戰(zhàn)視頻編碼的旅程。正因是“半路出家”,他的研究視角和長(zhǎng)期在此領(lǐng)域研究的人不太一樣。
比如,黃鐵軍巧妙地捕捉到,監(jiān)控視頻具有背景相對(duì)不變的特點(diǎn),提出了基于場(chǎng)景建模的視頻編碼方法。僅靠這項(xiàng)技術(shù),就把視頻編碼的效率提高了1倍。“采用現(xiàn)行標(biāo)準(zhǔn),全國(guó)3千萬(wàn)個(gè)攝像頭采集的視頻,若保質(zhì)保量存儲(chǔ)3個(gè)月的內(nèi)容就需要2千億元。用上這項(xiàng)技術(shù)后,等量的內(nèi)容存儲(chǔ)成本可降至500億元。”他說(shuō)。
云計(jì)算改變了信息的應(yīng)用和服務(wù)模式,但大量攝像頭拍攝的視頻很難傳至云端,于是黃鐵軍又“腦洞大開(kāi)”。
“傳到‘云’里的視頻不是給人看,而是給機(jī)器‘看’(進(jìn)行分析識(shí)別),所以只要傳回機(jī)器識(shí)別所需的視覺(jué)特征就可以了?!彼f(shuō),采用這個(gè)技術(shù)思路,視頻傳輸流量可減少90%以上,大大減輕了傳輸壓力。
基于上述兩項(xiàng)創(chuàng)新成果,由黃鐵軍牽頭的團(tuán)隊(duì)獲得了2017年度國(guó)家技術(shù)發(fā)明獎(jiǎng)二等獎(jiǎng)。
在新領(lǐng)域?qū)覄?chuàng)佳績(jī)的黃鐵軍,卻一直沒(méi)忘了自己的“老本行”——圖像識(shí)別。在該研究領(lǐng)域,他依舊體現(xiàn)出了與眾不同的研究視角。
長(zhǎng)久以來(lái),一些科學(xué)家習(xí)慣以人類自身為標(biāo)準(zhǔn)思考機(jī)器如何“看”,以為機(jī)器視覺(jué)和人類視覺(jué)一樣,但黃鐵軍卻不這么認(rèn)為。
“人總喜歡把自己的感受強(qiáng)加于別人,現(xiàn)在又強(qiáng)加于機(jī)器。一些人單純地以為,把視頻給機(jī)器看,機(jī)器就能識(shí)別,這種思路有些局限?!秉S鐵軍說(shuō),其實(shí)機(jī)器能比人“看”得更準(zhǔn)、更快。
于是,跳出人類思維局限,打造真正的機(jī)器視覺(jué),即類腦視覺(jué),成了黃鐵軍當(dāng)下的目標(biāo)。
做真正有價(jià)值的東西
由黃鐵軍牽頭研制的超速全時(shí)仿視網(wǎng)膜芯片,便是他們向類腦視覺(jué)走出的探索一步。黃鐵軍把這款芯片,比作新一代人工智能的“電眼”。
它能干什么?“舉例來(lái)說(shuō),在高速旋轉(zhuǎn)的電風(fēng)扇葉片上寫(xiě)2個(gè)字,電風(fēng)扇轉(zhuǎn)起來(lái)后,人眼看到的是模糊一片,‘電眼’卻能把字看得清清楚楚?!彼f(shuō),“電眼”可用在人工智能界的“網(wǎng)紅”無(wú)人駕駛汽車、無(wú)人機(jī)和智能機(jī)器人上。
該芯片的研制團(tuán)隊(duì)中,有計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)、醫(yī)學(xué)等眾多領(lǐng)域的專家,形成了一個(gè)強(qiáng)大的跨學(xué)科隊(duì)伍,他們從生物和信息兩個(gè)角度進(jìn)行探索,最終才研制成功。
因?yàn)樵O(shè)計(jì)這只“電眼”,讓黃鐵軍有機(jī)會(huì)將視頻編碼與“老本行”圖像識(shí)別結(jié)合起來(lái),運(yùn)用上這兩種不同領(lǐng)域的技術(shù)?!耙郧?,我們實(shí)驗(yàn)室里的學(xué)生分兩撥搞研究,一撥做圖像識(shí)別,一撥做視頻編碼,就像兩條并行的鐵軌。現(xiàn)在,他們可以一起做項(xiàng)目,按照全新的技術(shù)體系,創(chuàng)造新的可能。”他說(shuō)。
實(shí)驗(yàn)室的學(xué)生對(duì)科技日?qǐng)?bào)記者說(shuō),開(kāi)放性思維是黃鐵軍的標(biāo)志性特點(diǎn)?!包S老師善于從全局角度看問(wèn)題,常會(huì)把兩種看似沒(méi)有關(guān)系的事物聯(lián)系在一起,讓它們碰撞出火花?!?
在生活中,黃鐵軍也依舊如此。他喜歡跟性格各異、領(lǐng)域不同的人打交道,他說(shuō)這樣能通過(guò)別人的視角來(lái)發(fā)現(xiàn)新問(wèn)題。
對(duì)科研,黃鐵軍表示自己喜歡另辟蹊徑,反對(duì)跟隨和模仿?!耙郧埃恍┛蒲腥藛T十分注重成果的數(shù)量,現(xiàn)在則更重視開(kāi)拓科研‘無(wú)人區(qū)’??蒲腥藛T應(yīng)該珍視自己的學(xué)術(shù)生命,做真正有價(jià)值的東西,否則你所做的事情就會(huì)像沙灘上的腳印,一陣?yán)舜蜻^(guò)來(lái)就會(huì)無(wú)影無(wú)蹤?!彼f(shuō)。