騎自行車和開飛機(jī)哪個(gè)更難?與大多數(shù)人想當(dāng)然的答案“開飛機(jī)”不同,計(jì)算機(jī)科學(xué)家給出的答案是騎自行車。
如果要實(shí)現(xiàn)無人駕駛自行車,除了需要解決啟動、加速、勻速前行、轉(zhuǎn)彎、變道、避障等動作外,還需要面對識別紅綠燈和機(jī)動車車道、語音信號、感知周圍環(huán)境,還要感知周圍人車的速度以及預(yù)判變道對周圍人車是否產(chǎn)生干擾。而大部分民航飛機(jī)上都安裝了自動駕駛系統(tǒng)。
用美國加州大學(xué)圣塔芭芭拉分校博士后鄧?yán)诘恼f法,比起自動駕駛飛機(jī),無人自行車看起來很小,但實(shí)際上是一個(gè)五臟俱全的小型類腦技術(shù)平臺,“這實(shí)際上是對我們的考量”。
如今這個(gè)考量過關(guān)了。清華大學(xué)類腦計(jì)算研究中心主任施路平團(tuán)隊(duì)的人工通用智能芯片“天機(jī)芯”(Tianjic)讓無人駕駛自行車成為現(xiàn)實(shí)。

這是一款被賦予了巨大野心的人工智能芯片。8 月 1 日,這個(gè)研究作為封面文章發(fā)表在了《自然》雜志(Nature)上(下稱 Nature 論文),封面標(biāo)題是《雙重控制》(Dual control)。
無人自行車問世
施路平和同事研發(fā)了一款實(shí)現(xiàn)異構(gòu)融合的電子芯片,這款名為“天機(jī)芯”的芯片可以整合現(xiàn)有人工網(wǎng)絡(luò)算法,類腦的脈沖神經(jīng)網(wǎng)絡(luò)算法,同時(shí)支持神經(jīng)科學(xué)發(fā)現(xiàn)的眾多神經(jīng)回路網(wǎng)絡(luò)和異構(gòu)網(wǎng)絡(luò)的混合建模,發(fā)揮它們各自的優(yōu)勢。在自行車上利用一塊“天機(jī)芯”同時(shí)運(yùn)行了包括卷積神經(jīng)網(wǎng)絡(luò)在內(nèi)的 5 種不同神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了無人自行車駕駛。

這個(gè)無人智能自行車系統(tǒng)包括了激光測速、陀螺儀、攝像頭等傳感器,剎車電機(jī)、轉(zhuǎn)向電機(jī)、驅(qū)動電機(jī)等致動器,以及控制平臺、計(jì)算平臺、天機(jī)板級系統(tǒng)等處理平臺等。
無人自行車可以實(shí)時(shí)感知周圍環(huán)境,跟隨前方的試驗(yàn)人員并自動進(jìn)行避障的操作,并根據(jù)語音指令、視覺感知的反饋產(chǎn)生實(shí)時(shí)信號對電機(jī)進(jìn)行控制,以達(dá)到保持平衡,改變行進(jìn)狀態(tài)(包括橫向和縱向)。這款自行車實(shí)現(xiàn)了多模態(tài)信息集成,能夠維持平衡,并跟據(jù)目標(biāo)人物的位置控制自行車轉(zhuǎn)向,完成實(shí)時(shí)追蹤。
施路平認(rèn)為,人工通用智能芯片能夠成功,多學(xué)科深度融合才是關(guān)鍵。
讓大腦攜手電腦來實(shí)現(xiàn)人工通用智能
目前基于馮·諾依曼架構(gòu)的計(jì)算機(jī)擅長的是解決有充足大數(shù)據(jù)、完整靜態(tài)知識的確定性問題,比如深度學(xué)習(xí)在圍棋比賽、圖像識別等領(lǐng)域已經(jīng)完勝人類,但它還不能解決沒有那么多數(shù)據(jù)的、動態(tài)知識不夠多的模糊性問題。要知道人的大腦在能耗只有 20 瓦的前提下可以并行解決視覺、聽覺、嗅覺、觸覺等多模態(tài)信息,甚至能夠在有限經(jīng)驗(yàn)的時(shí)候舉一反三。
計(jì)算機(jī)和人類各有所長,人們需要打通兩者的鴻溝。施路平認(rèn)為,人工通用智能是一個(gè)必然的趨勢,而異構(gòu)融合,也就是讓兩種計(jì)算結(jié)合正是這把鑰匙。
Nature 論文的共同第一作者鄧?yán)谠谄淝迦A大學(xué)博士論文《異構(gòu)融合類腦計(jì)算平臺的計(jì)算模型與關(guān)鍵技術(shù)研究》中提到,類腦計(jì)算的本質(zhì)應(yīng)該是通過借鑒大腦信息處理的方式,獲得解決人工通用智能問題的能力,而深度學(xué)習(xí)和神經(jīng)形態(tài)都只是實(shí)現(xiàn)理想類腦計(jì)算的手段。他的導(dǎo)師、清華大學(xué)儀器科學(xué)與技術(shù)研究所副研究員裴京是 Nature 論文的第一作者。
Nature 研究的核心是這款異構(gòu)融合的芯片,它是一款特別的人工智能芯片。它結(jié)合了類腦計(jì)算和基于計(jì)算機(jī)科學(xué)的人工智能。這也是 Nature 封面為何是“雙重控制”的原因。

異構(gòu)融合的人工智能是一種多模態(tài)系統(tǒng)。駕駛自行車就是一個(gè)多模態(tài)任務(wù),它需要語音識別,也需要視覺識別和追蹤,這需要自行車上的電機(jī)或者傳感器來發(fā)送和接受信息數(shù)據(jù),而系統(tǒng)對兩者信息處理的編碼模式是不一樣的,這就是所謂多模態(tài)。那么這個(gè)復(fù)雜的多模態(tài)任務(wù)就成了施路平團(tuán)隊(duì)驗(yàn)證其異構(gòu)融合成果的展示平臺。
對于“天機(jī)芯”的未來應(yīng)用前景,裴京表示,由于這是一款異構(gòu)融合芯片,因此不管是深度學(xué)習(xí)加速器還是神經(jīng)形態(tài)芯片能夠做到的事情,“天機(jī)芯”都能完成。同時(shí),兩者的結(jié)合能夠完成一些原本單獨(dú)無法完成的任務(wù)。
比如在運(yùn)動視頻分析中,若使用機(jī)器學(xué)習(xí)算法模型,由于傳感器輸出數(shù)據(jù)的速度有限且數(shù)據(jù)量大,通常會造成卡頓;用神經(jīng)形態(tài)的方法,雖然數(shù)據(jù)量較少,但同時(shí)精度也會降低不少。而將兩種模態(tài)結(jié)合后,則能在兩者之間在代價(jià)和功能方面進(jìn)行很好的平衡。
除了無人自行車,該芯片在自動駕駛汽車、智能機(jī)器人等領(lǐng)域上也有極大的發(fā)揮空間。此外,因其低能耗、低成本,這個(gè)芯片會在家庭和服務(wù)性場景中得到廣泛應(yīng)用。
據(jù)施路平透露,目前,“天機(jī)芯”已經(jīng)在北京靈汐科技有限公司開始進(jìn)行下一步開發(fā)。
專訪施路平團(tuán)隊(duì):如何理解異構(gòu)融合?
DeepTech:如何理解異構(gòu)融合?為什么說將類腦計(jì)算和機(jī)器學(xué)習(xí)融合是一個(gè)更好的做法?
施路平:異構(gòu)融合有基于電腦的一套計(jì)算范式,也有基于人腦的一套計(jì)算范式,從大的思路上來講,我們希望把這兩個(gè)范式能夠融合起來,因?yàn)樗奶攸c(diǎn)是能夠互補(bǔ)。
我們認(rèn)為現(xiàn)在的計(jì)算機(jī)是將多維的信息轉(zhuǎn)換成一維的信息流,主頻越來越快,換句話說這是利用了時(shí)間復(fù)雜度;而在人腦中,一個(gè)神經(jīng)元連接著 1 千到 1 萬個(gè)神經(jīng)元,這是利用了空間復(fù)雜度,且大腦是利用脈沖進(jìn)行編碼,換句話說這就引入了時(shí)間復(fù)雜度,因此代表了時(shí)空復(fù)雜度。
類腦計(jì)算就同時(shí)具備了空間復(fù)雜度和時(shí)空復(fù)雜度,這就是異構(gòu)融合。事實(shí)上,異構(gòu)融合的架構(gòu)包含了多層的信息,有類腦和電腦的融合、計(jì)算和存儲的融合、空間復(fù)雜性和時(shí)間復(fù)雜性的融合、空間編碼和時(shí)間編碼的融合,還有精確計(jì)算和近似計(jì)算的融合。
DeepTech:在實(shí)現(xiàn)通用人工智能的過程里,將人腦思維、計(jì)算機(jī)思維結(jié)合到一起的做法是不是業(yè)界、學(xué)界的共識?是否有其他的實(shí)現(xiàn)路徑?
施路平:將兩者結(jié)合的方法得到了很多業(yè)界人士和學(xué)者的認(rèn)可,但核心的難度在于這是一個(gè)跨學(xué)科的研究,因此能夠組織起多個(gè)院系共同研究的團(tuán)隊(duì)還不多。
此前所有來到清華交流的學(xué)術(shù)團(tuán)隊(duì)都認(rèn)為我們這種交融和交叉模式是最成功的一個(gè)類腦計(jì)算的模式。同時(shí)歐洲也有團(tuán)隊(duì)將這種融合的模式作為一個(gè)課題提出。
DeepTech:如果是說我有兩個(gè)芯片,一個(gè)芯片是類腦芯片,一個(gè)是電腦芯片,那么兩個(gè)芯片能在同一個(gè)機(jī)器人身上運(yùn)行實(shí)現(xiàn)異構(gòu)融合效果嗎?
施路平:這樣不能實(shí)現(xiàn)異構(gòu)融合。你這個(gè)問題在論文審稿的過程當(dāng)中討論過。從原理上講可以,但是從實(shí)際上講很難。為什么很難?兩個(gè)芯片有不同的接口,其速度、性質(zhì)、編碼匹配,運(yùn)行起來很困難。經(jīng)過了反復(fù)論證,審稿人最后接受了我們的解釋。
有審稿人問,同一個(gè)芯片上兩個(gè)模塊的協(xié)作和兩個(gè)不同模塊的芯片協(xié)作有何不同?要理解這個(gè)太復(fù)雜了。這相當(dāng)于大腦的黑匣子,我們對大腦知之甚少,對左腦和右腦的協(xié)作知之甚少。這也是我們碰到的最難的問題之一。
DeepTech:在這個(gè)無人自行車試驗(yàn)中,我們能看到的哪些方面(或功能)是體現(xiàn)模擬人類大腦的,哪些方面(或功能)是體現(xiàn)機(jī)器學(xué)習(xí)算法的?
鄧?yán)?/strong>:自行車的語音識別、環(huán)境感知、平衡控制、避障等功能都需要背后的模型算法提供支持才能實(shí)現(xiàn),這其中就包括了不同模態(tài)的模型。如語音識別、自主決策以及視覺追蹤是模擬大腦的,而目標(biāo)探測、運(yùn)動控制以及躲避障礙等,則需要通過機(jī)器學(xué)習(xí)算法完成。
傳統(tǒng)的人工智能芯片僅能支持單一類別的模型,如深度學(xué)習(xí)或計(jì)算神經(jīng)科學(xué)的模型,而“天機(jī)芯”則實(shí)現(xiàn)了多模態(tài)模型的交互。
DeepTech:“天機(jī)芯”是兩者結(jié)合的完美結(jié)果嗎?
施路平:我們認(rèn)為,“天機(jī)芯”是到目前為止最完美的結(jié)果。未來還會怎么樣?我們還會進(jìn)一步的完善。這正是類腦的思想,就是大腦里頭的噪聲,它實(shí)際上和電路里的噪聲不一樣,它是一個(gè)試錯(cuò)機(jī)制。試錯(cuò)迭代發(fā)展,這是我們發(fā)展類腦計(jì)算的一個(gè)重要的基本原理,所以我們會基于這樣的原理,不斷地來完善。
DeepTech:施教授曾說過,類腦智能有一個(gè)通用的智能核,可以幫助我們解決各種問題,那么在你看來類腦智能的發(fā)展有幾個(gè)階段,如今到了哪個(gè)階段?
施路平:我認(rèn)為人類腦智能實(shí)際上是通用智能,我們實(shí)際上是基于一個(gè)通用的智能體來幫助我們解決所有的問題。原則上,人工通用智能平臺可以執(zhí)行人類能夠完成的所有任務(wù)。
因?yàn)槲覀儠龅脚e一反三,我們解決一個(gè)問題,那么可以幫助我們解決另外的問題。而現(xiàn)有的專用人工智能只能對一個(gè)問題提出一個(gè)解決方法,所以我們需要發(fā)展人工通用智能。
至于發(fā)展人工通用智能需要幾個(gè)階段,我們目前還只是有一些粗淺的認(rèn)識。我們看清楚的一點(diǎn)是,我們需要一步一步把前述 5 個(gè)融合的限制(即充足的數(shù)據(jù)、確定的問題、完整的知識、靜態(tài)和單一的問題)一步一步地來解決,這起碼作為一個(gè)階段。我們還需要找到不同領(lǐng)域的解決方案,這是第二個(gè)階段。
至于往后,我們相信還會有不同的階段。因?yàn)檫@個(gè)領(lǐng)域是非常具有挑戰(zhàn)性,我們在目前還不敢對這個(gè)問題妄下結(jié)論。這正是研究的魅力。
媒體聲音
《麻省理工科技評論》認(rèn)為,這款無人自行車顯示出中國在 AI 芯片領(lǐng)域研究水平的提升。文章稱,盡管還不能制造最先進(jìn)的計(jì)算機(jī)芯片,但中國在制造特別領(lǐng)域的芯片水平不輸于任何人。
《新科學(xué)家》引述博世公司(Bosch)Alessandro Oltramari 看法稱,這種混合芯片有可能會解決任何問題,只是通用人工智能還有很長一段路要走。“天機(jī)芯”還需要在其他任務(wù)中證明其通用人工智能的能力,如操縱物體、玩游戲或進(jìn)行對話。
Alessandro Oltramari 認(rèn)為,這個(gè)芯片不是在試圖復(fù)制人類大腦,而是在模仿人類的思維方式,如注意力、記憶力和預(yù)測能力。
參考文獻(xiàn):
https://www.nature.com/articles/s41586-019-1424-8
https://www.technologyreview.com/f/614042/this-autonomous-bicycle-shows-chinas-rising-ai-chip-expertise/
https://www.newscientist.com/article/mg24332414-000-this-self-riding-bicycle-follows-you-around-while-you-walk/