由此,假定我們站在特斯拉和馬斯克的角度來(lái)思考:作為自動(dòng)駕駛汽車品牌的領(lǐng)導(dǎo)者和自動(dòng)駕駛概念的最大商業(yè)受益者,特斯拉已經(jīng)有一套視覺攝像頭方案量產(chǎn),獲得了市場(chǎng)的認(rèn)可,同時(shí)積累了大量的數(shù)據(jù);作為攝像頭自動(dòng)駕駛最成功的商業(yè)案例,特斯拉對(duì)單獨(dú)攝像頭方案充滿信心,并輸出這個(gè)信心給市場(chǎng)和用戶,是完全必須和應(yīng)該的邏輯。相反,如果這個(gè)時(shí)候站出來(lái)說(shuō)多傳感器融合,多少有可能被“誤讀”成單獨(dú)攝像頭方案還有些許缺陷和不足,將來(lái)需要其他傳感器來(lái)補(bǔ)充。
對(duì)于汽車這種長(zhǎng)生命周期的產(chǎn)品而言,這種信息導(dǎo)向,很可能打擊一些潛在用戶的買車欲望,而客觀上市場(chǎng)上又確實(shí)沒有性價(jià)比足夠高的固態(tài)激光雷達(dá)可以供特斯拉采用,作為一個(gè)成熟、務(wù)實(shí)的著名汽車廠,這顯然是特斯拉時(shí)下不希望看到的“死循環(huán)”局面。
既然人類可以只靠肉眼這樣單一傳感器完成汽車駕駛,為什么AI不能通過(guò)視覺攝像頭完成自動(dòng)駕駛?
要想回答這個(gè)問(wèn)題,我們還要對(duì)人眼的視覺識(shí)別進(jìn)行稍微深入一點(diǎn)兒的分析。
首先,人眼的視覺是個(gè)高度智能化、自動(dòng)化的復(fù)雜系統(tǒng),具有定焦、對(duì)焦、變焦、多區(qū)域視覺等等功能。
比如駕駛過(guò)程中,我們的視線會(huì)在遠(yuǎn)景、近景切換焦距和成像,并且在即便是近景的情況下,對(duì)遠(yuǎn)景的目標(biāo),特別是運(yùn)動(dòng)目標(biāo)也具備檢測(cè)功能,從而在遠(yuǎn)處有運(yùn)動(dòng)目標(biāo)的時(shí)候,通過(guò)調(diào)整眼球晶狀體將成像面快速切換到遠(yuǎn)距離目標(biāo)。
與此同時(shí),我們對(duì)于需要特別關(guān)注的目標(biāo),比如路面障礙物,我們可以“定睛一看”,進(jìn)行特定區(qū)域的細(xì)致成像,提供局部目標(biāo)視覺分辨率。
此外,我們還可以通過(guò)頸部、頭部的動(dòng)作,調(diào)整我們眼睛的視角和視覺范圍,避免視覺死角,同時(shí)把視網(wǎng)膜有限的成像分辨率用在特別關(guān)注的目標(biāo)區(qū)域的成像。
我們還有高度智能化、自動(dòng)化的瞳孔“光圈”,控制眼睛的進(jìn)光量,適用于不同的外界光照情況。
而車載自動(dòng)駕駛電子攝像頭,基本都是固定焦距、固定FOV、固定光圈、固定位置安裝的,完全不具備人眼的自動(dòng)化和靈活性。這也解釋了為什么人類可以兩只眼睛“包打天下”,而自動(dòng)駕駛要用十幾個(gè)甚至二十幾個(gè)攝像頭的原因。
舉個(gè)例子,安裝在車頭位置的前向攝像頭就需要配置多個(gè),用以負(fù)責(zé)近距離、中距離,遠(yuǎn)距離的視覺成像。之所以采用多攝像頭分工,而不是采用人眼這種“通用”攝像頭,除了成本的考量之外,關(guān)鍵還是要實(shí)現(xiàn)人眼類似的智能化、自動(dòng)化,必然使用大量電機(jī)、機(jī)械運(yùn)動(dòng)、控制部件,比如調(diào)整焦距的電機(jī),在汽車這種使用環(huán)境里是非常有技術(shù)挑戰(zhàn)的。原因是,汽車的使用環(huán)境高低溫工作范圍大,運(yùn)動(dòng)與震動(dòng)強(qiáng)烈,而無(wú)故障運(yùn)行時(shí)間要求很長(zhǎng)。
小結(jié)一下,由于汽車使用環(huán)境的嚴(yán)酷性,大家最終選擇了“固態(tài)”攝像頭,而當(dāng)前這個(gè)“固態(tài)”攝像頭的智能化、自動(dòng)化、靈活性水平,和人眼相對(duì)比還有很大的差距。
另外,在測(cè)量距離這個(gè)指標(biāo)上,攝像頭視覺甚至包括人眼,對(duì)比起激光雷達(dá)都有巨大的劣勢(shì)。因?yàn)閺墨@取距離(深度)信息的原理上,不同于激光雷達(dá)的直接測(cè)量法,視覺測(cè)距的實(shí)際精度和準(zhǔn)確性都與被測(cè)物體,以及背景圖像的特點(diǎn)有很大的相關(guān)性,這種測(cè)距原理,在特殊的背景和目標(biāo)場(chǎng)景下,就有可能會(huì)出現(xiàn)測(cè)距算法失效的可能性。而人眼還可以通過(guò)歪歪頭等“機(jī)械”動(dòng)作,調(diào)整一下視角,獲取不同角度的圖像,提高三角測(cè)距法的準(zhǔn)確性。
即便如此,人眼對(duì)距離感知,對(duì)低照度也有先天的不足。好在從進(jìn)化論的角度,人眼的視覺能力足以“應(yīng)付”我們進(jìn)化歷史上漫長(zhǎng)的“靠腿運(yùn)動(dòng)”的“低速” 時(shí)代。而汽車這種高速運(yùn)動(dòng)的機(jī)器誕生的時(shí)間,與人類的歷史相比極其短暫。
那么,在人類的視覺還沒有進(jìn)化出(或許也不可能進(jìn)化出)新的傳感器功能之前,我們借用一下激光雷達(dá)、毫米波雷達(dá)這樣有專長(zhǎng)的傳感器測(cè)測(cè)距離,也許是合理和聰明的選擇。就像我們?cè)跊]有野生動(dòng)物夜視能力的情況下,可以借用手電筒、汽車大燈,來(lái)走暗夜中的漫漫長(zhǎng)路一樣。
所以,多傳感器融合對(duì)自動(dòng)駕駛應(yīng)該是一個(gè)合理和幾乎必然的趨勢(shì)。至于哪種傳感器在自動(dòng)駕駛算法上起的的作用更大,可能不是傳感器企業(yè)最關(guān)心的事情,而是做算法的人更關(guān)心的事情。
2、傳感的原理:攝像頭、毫米波雷達(dá)和激光雷達(dá)