比如,黃鐵軍巧妙地捕捉到,監(jiān)控視頻具有背景相對不變的特點,提出了基于場景建模的視頻編碼方法。僅靠這項技術,就把視頻編碼的效率提高了1倍?!安捎矛F(xiàn)行標準,全國3千萬個攝像頭采集的視頻,若保質保量存儲3個月的內容就需要2千億元。用上這項技術后,等量的內容存儲成本可降至500億元。”他說。
云計算改變了信息的應用和服務模式,但大量攝像頭拍攝的視頻很難傳至云端,于是黃鐵軍又“腦洞大開”。
“傳到‘云’里的視頻不是給人看,而是給機器‘看’(進行分析識別),所以只要傳回機器識別所需的視覺特征就可以了?!彼f,采用這個技術思路,視頻傳輸流量可減少90%以上,大大減輕了傳輸壓力。
基于上述兩項創(chuàng)新成果,由黃鐵軍牽頭的團隊獲得了2017年度國家技術發(fā)明獎二等獎。
在新領域屢創(chuàng)佳績的黃鐵軍,卻一直沒忘了自己的“老本行”——圖像識別。在該研究領域,他依舊體現(xiàn)出了與眾不同的研究視角。
長久以來,一些科學家習慣以人類自身為標準思考機器如何“看”,以為機器視覺和人類視覺一樣,但黃鐵軍卻不這么認為。
“人總喜歡把自己的感受強加于別人,現(xiàn)在又強加于機器。一些人單純地以為,把視頻給機器看,機器就能識別,這種思路有些局限。”黃鐵軍說,其實機器能比人“看”得更準、更快。
于是,跳出人類思維局限,打造真正的機器視覺,即類腦視覺,成了黃鐵軍當下的目標。
做真正有價值的東西
由黃鐵軍牽頭研制的超速全時仿視網(wǎng)膜芯片,便是他們向類腦視覺走出的探索一步。黃鐵軍把這款芯片,比作新一代人工智能的“電眼”。
它能干什么?“舉例來說,在高速旋轉的電風扇葉片上寫2個字,電風扇轉起來后,人眼看到的是模糊一片,‘電眼’卻能把字看得清清楚楚。”他說,“電眼”可用在人工智能界的“網(wǎng)紅”無人駕駛汽車、無人機和智能機器人上。
該芯片的研制團隊中,有計算機科學、神經(jīng)科學、醫(yī)學等眾多領域的專家,形成了一個強大的跨學科隊伍,他們從生物和信息兩個角度進行探索,最終才研制成功。
因為設計這只“電眼”,讓黃鐵軍有機會將視頻編碼與“老本行”圖像識別結合起來,運用上這兩種不同領域的技術。“以前,我們實驗室里的學生分兩撥搞研究,一撥做圖像識別,一撥做視頻編碼,就像兩條并行的鐵軌?,F(xiàn)在,他們可以一起做項目,按照全新的技術體系,創(chuàng)造新的可能?!彼f。
實驗室的學生對科技日報記者說,開放性思維是黃鐵軍的標志性特點。“黃老師善于從全局角度看問題,常會把兩種看似沒有關系的事物聯(lián)系在一起,讓它們碰撞出火花。”
在生活中,黃鐵軍也依舊如此。他喜歡跟性格各異、領域不同的人打交道,他說這樣能通過別人的視角來發(fā)現(xiàn)新問題。
對科研,黃鐵軍表示自己喜歡另辟蹊徑,反對跟隨和模仿。“以前,一些科研人員十分注重成果的數(shù)量,現(xiàn)在則更重視開拓科研‘無人區(qū)’??蒲腥藛T應該珍視自己的學術生命,做真正有價值的東西,否則你所做的事情就會像沙灘上的腳印,一陣浪打過來就會無影無蹤?!彼f。