攝像頭or激光雷達 誰是自動駕駛感知之王
【太平洋汽車網(wǎng) 行業(yè)頻道】作為乘用車自動駕駛領(lǐng)域的領(lǐng)頭羊,特斯拉在純視覺這條路上走的十分決絕,甚至連僅有的毫米波雷達,也在前不久被特斯拉拋棄了。然而,在感知層面,領(lǐng)頭羊幾乎快成了“獨羊”,更多的品牌不約而同的在感知方案中加入了激光雷達的選項,甚至已經(jīng)“卷”了起來。
不同于上海車展激光雷達剛剛上車時給我們的震感,經(jīng)過半年多的發(fā)展,廣州車展上大家對各家展臺上普遍出現(xiàn)的激光雷達方案已經(jīng)習(xí)以為常。在這樣的大環(huán)境下,對激光雷達的宣傳也變得五花八門,廣汽埃安打出了3顆激光雷達”領(lǐng)先一代“的口號;而長城旗下的全新品牌沙龍,更是直接在宣傳海報上挑釁式的寫到”4顆以下別說話“......
純視覺路線和感知融合路線之爭,已經(jīng)是老生常談的話題了。從傳感器上來說,攝像頭本身有著絕對的優(yōu)勢,只聞馬斯克毅然砍掉毫米波雷達,不見哪家鐵憨憨敢直接踢掉攝像頭。即便是激光雷達的堅定支持者,感知方案中一樣需要將攝像頭擺在足夠重要的位置。
這是整個社會環(huán)境,甚至是億萬年來的自然環(huán)境決定的。我們的地球身處太陽系,享受著陽光給予地球的能量。而太陽輻射的能量,絕大部分是波長在380~780nm之間可見光,當然也有不少臨近的紅外線和紫外線,而地球大氣層中的臭氧層盡職盡責的幫我們過濾掉了絕大部分紫外線,讓我們免受皮膚癌等問題的侵擾。所以,地球上的生物進化出了可以通過可見光觀察周遭事物的眼睛。
而快速發(fā)展的人類文明,也是基于人自身的感知能力進行建設(shè),交通系統(tǒng)都保證人通過肉眼就能夠做出判斷,不需要給司機植入各種天線才能開車。所以,能夠模擬人眼觀察世界方式的攝像頭,自然也成為了機器感知的重要途徑,畢竟機器也身處地球。
包括自動駕駛在內(nèi)的機器學(xué)習(xí)依賴近幾年高速發(fā)展的人工智能技術(shù)的進步,人工智能依賴的深度學(xué)習(xí)算法需要海量的數(shù)據(jù)進行訓(xùn)練。芯片算力的提升和移動互聯(lián)網(wǎng)發(fā)展形成的海量數(shù)據(jù)是人工智能近幾年能夠高速發(fā)展的重要基礎(chǔ),我們能夠訓(xùn)練出什么樣的算法,強依賴我們有什么樣的數(shù)據(jù)。我們有什么數(shù)據(jù)?最多的當然是基于可見光拍攝的照片,人手一部的手機幾乎都帶有攝像頭,激光雷達可沒普及到這種程度。這也是人工智能快速發(fā)展中,發(fā)展最快的基礎(chǔ)應(yīng)用是語音識別和圖像識別的重要原因,因為這里有人本身能夠大量創(chuàng)造的數(shù)據(jù),也是人們最基礎(chǔ)的需求。
攝像頭的重要性已經(jīng)毋庸置疑,那激光雷達是不是全無意義的雞肋?這很難有定論,但至少當下來看并非如此。人通過眼睛感知世界,是有強大的大腦作為堅實后盾的。到目前為止,想讓芯片擁有比擬人腦的能力還做不到。人工智能已經(jīng)可以在棋類游戲中擊敗人類,甚至是圍棋這樣無法通過暴力計算解決的棋類。但想在環(huán)境復(fù)雜多變的駕駛方面比肩人腦,人工智能還只能高呼”臣妾做不到啊“。
在特定的場景下,通過充足的深度學(xué)習(xí)訓(xùn)練,機器憑借其不犯錯的能力能夠做到比人更好。問題在于,公開道路并非單調(diào)的特定環(huán)境。我們可以把自動駕駛可能面對的場景分為四個大類:1、已知的安全場景;2、已知的不安全場景;3、未知的不安全場景;4、未知的安全場景。窮盡未知的場景,在自動駕駛發(fā)展的這短短幾年間顯然無法做到。
視覺最大的優(yōu)勢在于可以通過數(shù)據(jù)訓(xùn)練準確的認識視野內(nèi)的目標物體,而他最大的問題就是對訓(xùn)練不充足的目標可能會認錯。以自動駕駛領(lǐng)頭羊特斯拉為例,由于數(shù)量龐大,也給我們展示了很多生動的案例,比如高懸空中超過38萬公里的紅綠燈,比如在馬路上狂奔的尖叫雞,比如在公交車后一路狂奔的曾志偉,也有落在馬路上的“云彩”這種后果嚴重的錯誤。
激光雷達的優(yōu)勢就在這里,雖然目前沒有海量的數(shù)據(jù)庫,也沒有人類直觀的標記給做深度學(xué)習(xí)算法做訓(xùn)練,但是激光雷達可以精準的對周遭環(huán)境進行3D建模,任何障礙物的詳細尺寸、距離都能夠一目了然。很可能,系統(tǒng)沒法通過算法認出前方的障礙物是什么,但可以明確的知道他在那里,不剎車就會撞上。這時即便視覺判斷出了偏差,系統(tǒng)仍然能夠做出正確的決策。
在自動駕駛逐步成熟的道路上,新發(fā)現(xiàn)的每一個未知場景都能帶來一次進步,但這往往是將用戶置于危險或瀕臨危險的環(huán)境中作為代價。激光雷達不是全能的神,但至少他有能力減少讓用戶身處危險場景的可能。
大自然五彩繽紛,我們總認為我們看到的就是世界本來的面貌。但真的是這樣嗎?
孔雀開屏的絢麗讓人類也為之動容,很多鳥類的雄性都有著華麗的外表來吸引異性的注意,但有沒有想過,烏鴉等為什么通體漆黑?
人之所以能夠看到顏色是因為我們的視錐細胞能夠感知紅綠藍三種顏色的色素,紅綠藍也就是我們經(jīng)常提及的RGB,通過RGB的不同組合可以還原出自然界五彩繽紛的顏色,這也是顯示器等能夠模擬自然界色彩的基礎(chǔ)理論。但不同的生物對顏色的感知其實是不一樣的,你在看電視時,你的寵物或許會疑惑這個“鏟屎官”為啥能忍受這么嚴重的偏色?不過貓、狗除外,研究表明,哺乳動物中只有人類所在的靈長目進化出了感知顏色的視覺系統(tǒng),包括貓、狗在內(nèi)的絕大多數(shù)哺乳動物眼中的世界都是灰蒙蒙的。
然而神奇的是,鳥、魚、兩棲類甚至昆蟲或許能夠感知比人更豐富的色彩,它們眼中有四種色素,比人多一種。例如鳥類,他們普遍對藍色有很強的感知,可以看到部分人眼看不到的紫外線。我們?nèi)祟惪吹降钠岷跒貘f等鳥類,在其同類眼中通過反射紫外線,其實也有著斑斕的色彩。“天下烏鴉一般黑”不過是人的偏見而已,烏鴉如果能聽懂,可能40米的大長刀早就出鞘了。
回到自動駕駛,其實我們不用糾結(jié)是不是擬人的攝像頭才是最強的感知硬件,人看到的也不過只是世界的一小部分而已。如果更多樣的傳感器能夠讓系統(tǒng)感知更豐富的信息,又何必拘泥于可見光?當然前提是要在成本可控的基礎(chǔ)上,畢竟汽車依然是商品。
昆蟲有比人類多一種的視覺色素,那讓人生厭的蟑螂能看到比人更豐富的世界?并不見得。人類通過眼睛看世界,更通過大腦“知”世界。獲得的信息沒有很好的處理,那就不過是一堆單調(diào)無用的數(shù)據(jù)而已。對于自動駕駛,先進的算法比堆砌的感知硬件更重要,這也是特斯拉通過純視覺能夠成為自動駕駛領(lǐng)頭羊的重要原因。
說到這里大家或許首先想到的就是芯片的算力,對,算力很重要,但也不是唯一的參考。
自從解剖學(xué)讓我們搞懂了人類的生理結(jié)構(gòu),我們就一直在思考:為什么只有人能夠思考“為什么只有人能夠思考'為什么只有...‘”這個問題。開我們把原因指向了腦容量,智人為了這個大腦袋,在進化的過程中失去很多力量和速度,可是自然界中比人腦更大的大腦比比皆是,比如大象、比如藍鯨.....于是我們又把問題指向了大腦質(zhì)量和身體總重之比,那我們也只不過和小鼠相當而已.....
總之,人類的智力并不是簡單的大腦體積和重量決定的。而在自動駕駛領(lǐng)域,算力更多決定的是系統(tǒng)可以處理的數(shù)據(jù)量上限,而不完全能夠和自動駕駛能力對等。優(yōu)秀的算法和大量的訓(xùn)練才能帶來一個更安全高效的自動駕駛系統(tǒng)。
在2021廣州車展上,我們看到了越來越多的量產(chǎn)或準量產(chǎn)車型,憑借強大的智能硬件開始涉足自動駕駛或高階輔助駕駛,攝像頭從基礎(chǔ)的200萬像素到800萬像素的高清攝像頭,激光雷達從1顆到4顆,系統(tǒng)算力從幾TOPS到上千TOPS。硬件確實并非決定自動駕駛能力的全部,不過至少更強的硬件能夠帶來更高的安全冗余,一個廠商當前的算法能力是難以快速飆升的,那么更強的硬件對于其自身而言便也是更有意義的。而通過后期的OTA升級,更多的備份也能提供更多的可能性。
不過不管是廠商還消費者,一定要謹記當前的量產(chǎn)車匹配的自動駕駛?cè)匀惶幱贚2級輔助駕駛階段,不管在宣傳上還是使用中都切不可高估當前的系統(tǒng)能力,安全是自動駕駛的底線。我們對未來的完全自動駕駛汽車充滿期待,也在摸索中不斷的進步,但誰都不希望,進步的過程中有生命的代價。(文:太平洋汽車網(wǎng) 郭睿)
>>點擊查看今日優(yōu)惠<<