理論與實(shí)踐是差別很大的,AEB的論文與具體開發(fā)差別極大。本文主要說明AEB為什么有那么多限制,如何才能提高AEB系統(tǒng)的實(shí)用性。 再簡單重復(fù)一下目前AEB系統(tǒng)的局限性。首先AEB系統(tǒng)有明顯的速度上限和下限,一般來說單純以毫米波雷達(dá)為傳感器的AEB系統(tǒng)最高工作上限為時(shí)速30公里,以單目攝像頭為核心傳感器的AEB系統(tǒng)最高工作上限為時(shí)速40公里,單目與毫米波雷達(dá)融合的AEB最高工作上限為時(shí)速70公里,以雙目為核心傳感器的AEB系統(tǒng)最高工作上限為時(shí)速90公里。同時(shí)還有一個最低下限。以單目為核心傳感器的工作下限為時(shí)速8-10公里,毫米波雷達(dá)為時(shí)速5公里,攝像頭與毫米波雷達(dá)融合為時(shí)速3公里,雙目為3公里。 其次,目前絕大多數(shù)AEB都是只針對車輛的,對行人和騎車人無效或不明顯?;蛘哒f探測行人需要比較長的時(shí)間,碰撞時(shí)速度仍然較高。 第三,AEB對突然出現(xiàn)的靜止物體無效。車輛、大型動物、行人和騎車人,在被前車或側(cè)車遮蓋住視線,前車不再遮擋后突然出現(xiàn),AEB系統(tǒng)無法及時(shí)識別,特斯拉幾次事故都是如此。 第四,盲區(qū)明顯,車輛轉(zhuǎn)彎時(shí),AEB基本是無效的。迎面而來的交叉車流或轉(zhuǎn)彎車流,對面來車突然變道等等,AEB也是無效的。 第五,天氣和光線的局限。對于攝像頭為核心的AEB系統(tǒng),低照度情況下基本無效,高亮度如正對陽光也會無效。 典型的AEB系統(tǒng)構(gòu)成如下: 對于靜止物體,傳感器融合是不可缺少的。 首先要說融合的三個層次,分別是傳感器數(shù)據(jù)級(Data)、傳感器特征級(Feature)、決策級(Decision)。一般情況下都是數(shù)據(jù)級融合,主要是原始數(shù)據(jù)(可不是最原始的數(shù)據(jù),是從傳感器ECU輸出的數(shù)據(jù))融合,一般采用加權(quán)平均或卡爾曼濾波器算法實(shí)現(xiàn)融合。特征級融合則把形狀、深度、速度等數(shù)據(jù)融合,通常采用霍夫變換算法。決策級則對比多個決策,算法一般是貝葉斯算法。 上圖是Matlab的仿真模型,數(shù)據(jù)級融合通常都是以圖像傳感器為核心,用卡爾曼濾波器對雷達(dá)測量的距離信息進(jìn)行濾波后,得到世界坐標(biāo)系下前方車輛與攝像頭之間各個坐標(biāo)軸上的距離估計(jì), 通過坐標(biāo)映射對它們在二維圖像上進(jìn)行實(shí)時(shí)描述。這就是傳感器視覺化。 決定AEB系統(tǒng)反應(yīng)時(shí)間的,首先是執(zhí)行器的反應(yīng)時(shí)間,其次是處理器的反應(yīng)時(shí)間。 目前AEB系統(tǒng)的執(zhí)行器都依賴ESC或ESP,其從接到信號到輪缸有剎車油進(jìn)入需要大約300毫秒,到剎車力度達(dá)到最大需要550毫秒時(shí)間,而人類駕駛員只需要大約350毫秒,這個時(shí)間對速度為72公里的汽車意味著增加了4米的剎車距離。 下一代EHB系統(tǒng)可以將時(shí)間縮短400毫秒,僅需120-150毫秒就達(dá)到最大剎車力度,安全系數(shù)大大提高,同時(shí)也可以回收幾乎100%的剎車能量。目前正式量產(chǎn)使用的下一代EHB系統(tǒng)只有博世的iBooster和日立的e-Act。目前只用于新能源車領(lǐng)域。執(zhí)行器的反應(yīng)時(shí)間限制了AEB系統(tǒng)的工作上限。執(zhí)行器領(lǐng)域門檻很高,獨(dú)立廠家只有3家,分別是博世、天合(ZF)和大陸。 除了執(zhí)行器所花的時(shí)間,還有處理器所花的時(shí)間。對AEB開發(fā)系統(tǒng)者來說,ESP(ESC)是無法選擇的,因?yàn)槟鞘堑妆P工程師的領(lǐng)域,AEB開發(fā)者只能被動接受,處理器所花的時(shí)間一部分是圖像識別與距離輸出的時(shí)間,一部分是數(shù)據(jù)融合花費(fèi)的時(shí)間。如果是針對行人的圖像識別和數(shù)據(jù)融合,那么總共花費(fèi)的時(shí)間在150-450毫秒之間。 對于AEB系統(tǒng),視覺部分主要任務(wù)是計(jì)算出障礙物與車輛之間的距離,而不是識別障礙物是何類型的物體,路面上的大型障礙物都需要避免與之碰撞。對單目來說,要計(jì)算距離必須先識別物體,而雙目則是先計(jì)算距離,再識別或者不識別。 單目攝像頭的大致測距原理,是先通過圖像匹配進(jìn)行目標(biāo)識別(各種車型、行人、物體等),識別出物體的具體輪廓,特別是寬度,根據(jù)傳感器的尺寸,再通過目標(biāo)在圖像中的像素大小去估算目標(biāo)距離。這就要求在估算距離之前首先對目標(biāo)進(jìn)行準(zhǔn)確識別,是汽車還是行人,是貨車、SUV還是小轎車。準(zhǔn)確識別是準(zhǔn)確估算距離的第一步。要做到這一點(diǎn),就需要建立并不斷維護(hù)一個龐大的樣本特征數(shù)據(jù)庫,保證這個數(shù)據(jù)庫包含待識別目標(biāo)的全部特征數(shù)據(jù)。比如在一些特殊地區(qū),為了專門檢測大型動物,必須先行建立大型動物的數(shù)據(jù)庫;而對于另外某些區(qū)域存在一些非常規(guī)車型,也要先將這些車型的特征數(shù)據(jù)加入到數(shù)據(jù)庫中。對于車輛,這個數(shù)據(jù)庫還算好做,全球車型畢竟有限。對于行人,難度頗高,出了簡單的模型數(shù)據(jù)庫,先進(jìn)的要用HOG。識別準(zhǔn)確率越高,距離計(jì)算就越準(zhǔn)確。 而雙目檢測的方式就是通過對兩幅圖像視差的計(jì)算,直接對前方景物(圖像所拍攝到的范圍)進(jìn)行距離測量,而無需判斷前方出現(xiàn)的是什么類型的障礙物。雙目是測量距離,而不像單目是估算距離,理論上雙目精度可以達(dá)到毫米級。 11款車AEB測試數(shù)據(jù)對比 很明顯,雙目的計(jì)算距離所花費(fèi)時(shí)間遠(yuǎn)低于單目系統(tǒng),因此雙目的斯巴魯有絕對優(yōu)勢,盡管斯巴魯?shù)碾p目系統(tǒng)推出于2008年,但是比目前任何一款單目的AEB系統(tǒng)要好,包括特斯拉的三目系統(tǒng),比沃爾沃的XC60這種融合激光雷達(dá)、毫米波雷達(dá)和攝像頭三者融合的還要占優(yōu)。需要指出的是,XC60的激光雷達(dá)是簡易型非掃描型激光雷達(dá),價(jià)格非常低廉,低于毫米波雷達(dá)。 目前汽車領(lǐng)域最先進(jìn)的行人識別都是使用HOG,而非深度學(xué)習(xí)。深度學(xué)習(xí)的嵌入式應(yīng)用完全無法實(shí)現(xiàn),功耗和成本都太高,這并非其主要缺點(diǎn),最重要的是深度學(xué)習(xí)是一個黑盒子,它在某一個測試集上(如Kitti)表現(xiàn)很好,但是換一個測試集就表現(xiàn)很差,而其中的原因卻無從得知。深度學(xué)習(xí)的表現(xiàn)非常不穩(wěn)定,這對要求高可靠性的傳統(tǒng)汽車廠家來說完全無法接受。 HOG(Histograms of Oriented Gradients)是一個手工設(shè)計(jì)特征的淺度學(xué)習(xí)模型,HOG不止可以用來檢測行人,也可以檢測狗、貓等等幾乎任何物體,所做的工作只是訓(xùn)練樣本的不同,所以HOG特征可以稱為object檢測方法。 上面是HOG流程,最后一步需要行人分類器,根據(jù)大量的樣本構(gòu)建行人檢測分類器。提取的特征主要有目標(biāo)的灰度、邊緣、紋理、顏色、梯度直方圖等信息。OpenCV里有行人檢測分類器(線性SVM)的開源代碼,OpenCV自帶的分類器使用的是2005年CVPR那篇文章中作者訓(xùn)練好的分類器,所以設(shè)計(jì)起來并不難, 部分誤檢可以通過差分解決,但是在擁擠的人群里,誤檢率很高。不過不要怕,低速工況下搞個免責(zé)條款就OK啦。 上圖是東芝針對ADAS尤其是行人HOG檢測推出的一款A(yù)SIC,代號為Visconti2,用在豐田的大型車和普銳斯上,效果非常好。它采用了硬件加速器,速度遠(yuǎn)遠(yuǎn)超過IP軟內(nèi)核。 Visconti2的處理時(shí)間大約需要79.3毫秒,而一個1Ghz的CPU需要3.98秒。 Visconti2可能是目前最快的車用行人識別芯片,不過缺點(diǎn)也很明顯,太貴。東芝還推出了Visconti4芯片,速度更快,但是要到2018年量產(chǎn)。考慮到出貨量非常有限,東芝這款A(yù)SIC肯定是虧錢賣的,估計(jì)出貨量要達(dá)到500萬套才能覆蓋其研發(fā)成本。其他廠家多基于FPGA使用軟核IP做行人識別的,估計(jì)需要150-250毫秒,甚至300毫秒。優(yōu)點(diǎn)是芯片的價(jià)格可以便宜不少。 單目相對雙目缺點(diǎn)非常明顯,但優(yōu)點(diǎn)也很明顯,成本比較低,特別是邊際成本。雙目的缺點(diǎn)是計(jì)算量大,沒有合適的ASIC可用,只能選擇FPGA。而FPGA需用特別的VHDL/Verilog語言,這種類似于軟件畫電路圖的本事能掌握的人很少,所以限制了雙目的使用范圍。同時(shí)雙目系統(tǒng)對配對一致性要求極高,對于系統(tǒng)的機(jī)械加工精度要求高,雙目之間基線越長,性能越好,但機(jī)械精度和一致性要求就越高,因此只有斯巴魯敢用31厘米的基線,而寶馬的雙目都要遠(yuǎn)低于這個尺寸。 通常雙目是不識別物體類型的,當(dāng)然雙目也可以像單目那樣識別物體,不過雙目在行人檢測領(lǐng)域有獨(dú)特的方法,效率非常高,這就是Stixel(sticks above the ground in the image)。 所謂stixel就是指對圖片中地面以上的柱狀物體進(jìn)行建模,顯然,圖像中的樹木,人,海報(bào)之類的物體都可謂柱狀物。利用stereo image可以直接計(jì)算出stixel,而無需計(jì)算所有的深度(視差)信息。在進(jìn)行行人檢測時(shí),對圖像中的地面和stixel進(jìn)行估計(jì),并設(shè)置stixel的高度為1.75m,在CPU上可以達(dá)到135fps的速度,這是目前行人檢測領(lǐng)域最高效的算法。 AEB的盲區(qū)問題,主要源自攝像頭的FOV,就是視角的問題。FOV角度很寬,覆蓋面就很大,但有效距離就會縮短不少。FOV角度很窄,覆蓋面縮窄,近距離有明顯的盲區(qū),但有效距離會增加不少。通常取一個中間值,就是45度。三目就完美解決這個問題,它使用三個攝像頭,F(xiàn)OV分別是45、25、150度。既有長的有效距離也有寬的覆蓋面,但是幾個攝像頭之間的轉(zhuǎn)換過渡,需要設(shè)置濾波器來濾除相同的信息,這就增加了處理時(shí)間。 毫米波雷達(dá)和攝像頭一樣,也有FOV的問題。遠(yuǎn)距離毫米波雷達(dá)的FOV很窄,會在車前形成明顯的盲區(qū)。解決辦法有兩種,一種是增加兩個短距離毫米波雷達(dá),奧迪通常就采用這種做法。另一種是采用雙FOV的毫米波雷達(dá),這種雷達(dá)擁有兩套系統(tǒng),一套FOV很窄,一套FOV適中,德爾福有這種設(shè)計(jì)。 再有就是光照度的問題,低照度情況下,無論單目還是雙目,性能都會迅速下降。另外正對陽光時(shí),攝像頭也會失明,即便是動態(tài)范圍再高的攝像頭也無法避免。雖然這個失明只有幾秒鐘,但這就埋下了安全隱患。另外,進(jìn)出隧道時(shí),光照度的急劇變化也會讓攝像頭短暫失明,而這正是最危險(xiǎn)的階段。此外,雨雪霧霾也讓攝像頭幾乎無用武之地。 激光雷達(dá)可以彌補(bǔ)目前AEB系統(tǒng)中的大部分缺點(diǎn),并且4線或8線激光雷達(dá)就可以。激光雷達(dá)在雨雪霧霾時(shí),有效距離會下降,但仍然可保證準(zhǔn)確性和可靠性,只需要降低車速即可。即便是人類駕駛員,碰到雨雪霧霾也需要降低車速。而攝像頭,碰到雨雪霧霾幾乎無法工作。激光雷達(dá)也沒用盲區(qū)的問題,即使FOV很寬,有效距離也不會縮短,可以達(dá)到150米,而雙目(45度FOV)一般是50米。在距離計(jì)算上,激光雷達(dá)準(zhǔn)確度更高,效率也更高。當(dāng)然,激光雷達(dá)有個嚴(yán)重缺點(diǎn),成本太高,不過只要需求旺盛,成本自然可以快速下滑。 最后需要指出,一套完整的AEB開發(fā)系統(tǒng)最少需要2年的開發(fā)周期。 有些廠家急功近利,取消了最關(guān)鍵的驗(yàn)證測試和場地測試,直接上路,拿活人做小白鼠,這種藐視生命的態(tài)度,是萬萬不可取,早晚會有大麻煩的。
|
|