自動駕駛行業(yè),因為一個人的離職,要被改變了。
他是Andrej Karpathy,作為特斯拉AI大主管,在7月13日宣布自己從特斯拉離職。
(資料圖片)
作為AI的負(fù)責(zé)人,他五年前加入特斯拉,擔(dān)任神經(jīng)網(wǎng)絡(luò)和計算機視覺專家。五年時間內(nèi)迅速晉升,成為特斯拉Autopilot團隊的重要一員,在特斯拉開發(fā)FSD的過程中也發(fā)揮了非常重要的作用。
有多重要?我可以說,Andrej從特斯拉離職的真正原因,會決定自動駕駛行業(yè)技術(shù)接下來的發(fā)展方向。
為什么一個人僅僅離職就能對行業(yè)有影響?
因為Andrej在特斯拉工作期間,并沒有讓特斯拉跟隨著行業(yè)內(nèi)卷起的激光雷達(dá)上車熱潮,而是為自動駕駛行業(yè)踏出了一個全新、純視覺實現(xiàn)自動駕駛的方向。
實現(xiàn)純視覺自動駕駛不難,難的是讓這項技術(shù)真正可以在城市開放街道上實現(xiàn)。
馬斯克一直以來都堅信純視覺自動駕駛,因為在這位硅谷鋼鐵俠看來既然人可以通過兩只眼睛來駕駛車輛,那么機器一定也可以。他還曾經(jīng)表示馬就是自動駕駛,而人和馬的眼睛里,并不會射出激光。
Andrej在特斯拉成功證明純視覺自動駕駛這條技術(shù)路線是可行的,意義并不是幫特斯拉的量產(chǎn)車省下了兩顆或幾顆激光雷達(dá)的成本,而是在眾多自動駕駛發(fā)展路線中,成功證明了從L2發(fā)展到L5的可能性。
和以往通過攝像頭抓取的2D圖像進(jìn)行識別交通參與對象不同——在Andrej為特斯拉開發(fā)的新版FSD中,特斯拉通過布置在車周身的8個攝像頭,將獲取到的8個方向的二維平面圖像數(shù)據(jù)通過算法即時生成了車身周邊“4D向量空間”。
“4D向量空間”是什么?
本質(zhì)上講是在生成的虛擬三維空間基礎(chǔ)上再增加一個時間軸,這樣就可以根據(jù)其他車輛的過去行為來預(yù)測標(biāo)記物體在未來時間的運動。
通過Andrej的這套處理方案,讓機器幫人類駕駛汽車這件任務(wù),從一個識別平面圖并做預(yù)測圖片中物體會怎么變化的工作,變成了一個怎么在三維空間中規(guī)劃行駛路線的“游戲”。
更厲害的是,從特斯拉官方釋放的信息來看,這個為FSD設(shè)計的“游戲”內(nèi),事物、場景的精度會精確到像素級,也就意味著理論上它的精度甚至可以追趕上高精地圖——足夠精細(xì)的3D空間,也意味著對于特斯拉來說確實不需要激光雷達(dá)了。
行業(yè)里所追求的激光雷達(dá),到了特斯拉手上,作用就只是裝在部分測試車上去做3D生成場景的“校準(zhǔn)”——通過激光雷達(dá)的數(shù)據(jù)和車自己生成3D場景數(shù)據(jù)的對比,來加強這一套從二維平面換算到三維空間的算法的精準(zhǔn)度。
在自動駕駛最重要的兩個核心技術(shù):感知和決策上,Andrej僅僅依靠純視覺的方式,就讓特斯拉的自動駕駛在感知方面的精度提高了幾十倍甚至上百倍。
感知精度上的提升,反過來也會幫助車進(jìn)行更快、更準(zhǔn)確的決策。
比如搭載了兩顆前向激光雷達(dá)的小鵬P5,對前方的物體的感知能力,就比沒有搭載激光雷達(dá)的P7車型要強很多,這讓P5在涉及到前方的交通場景中可以比P7更快速、果斷做出決策,但對于激光雷達(dá)檢測不到的側(cè)后方,P5的感知能力就和P7保持在同一水平,決策方面也就和P7一致,無法做到比P7更準(zhǔn)確、果斷。
Andrej賦予了特斯拉用視覺比拼激光雷達(dá)的能力后,也就意味著感知不再是短板的特斯拉,理論上可以逐漸追上Waymo、Cruise、Argo AI、百度Apollo這些用了激光雷達(dá)的廠商所達(dá)到的無人駕駛水平。
感知的能力獲得巨大提升后,在決策方面特斯拉同樣有所創(chuàng)新。
這個創(chuàng)新要從自動駕駛行業(yè)存在的一個大問題講起:在AI決策方面,隨著訓(xùn)練里程數(shù)的增加,遇到問題場景的數(shù)量也在大幅度降低。
表面上看這似乎意味著自動駕駛AI能夠迅速進(jìn)步,但隨著簡單高頻的場景逐個被解決,待解決的低頻場景成為了抵達(dá)終點前的絆腳石——從幾百公里遇到一個問題變成幾千甚至幾萬公里才遇到一個問題時,意味著訓(xùn)練AI到我們所需要水平的時間、里程會以指數(shù)級增長,而這一過程沒有盡頭。
這就是為什么行業(yè)里每年都在說距離全自動駕駛的美好場景還有五年,但我們一直無法實現(xiàn)的原因。
要解決這個問題,就必須有更多的“問題場景”來提供給自動駕駛AI訓(xùn)練。
對于這個問題,特斯拉以訓(xùn)練自動駕駛AI的需求為基礎(chǔ),開發(fā)了名為Dojo的超級計算機,在Dojo中,一方面會用autopilot現(xiàn)實中遇到的困難場景的4D向量空間數(shù)據(jù)生成虛擬的世界,讓Autopilot在這里面反反復(fù)復(fù)訓(xùn)練,另一方面特斯拉也會自己制造更多的復(fù)雜、罕見場景用于自動駕駛AI訓(xùn)練。
特斯拉的AI訓(xùn)練模式,從發(fā)現(xiàn)問題——解決問題,就變成了自己制造問題——解決問題,毫無疑問,這樣對于Autopilot而言不必等現(xiàn)實世界中低頻次問題的發(fā)生,而是只需要讓特斯拉的工程師不斷在虛擬世界中創(chuàng)建問題就可以了。
“問題場景”出現(xiàn)頻次會隨著訓(xùn)練而降低,從而導(dǎo)致AI訓(xùn)練效率斷崖式下跌的問題被解決后,特斯拉打造的感知+決策+練系統(tǒng)已經(jīng)實現(xiàn)了完整的閉環(huán),目前使用完全自動駕駛(FSD)Beta的客戶車隊已經(jīng)行駛了超3500萬英里的里程,并且這個速度正在加快。
接下來Andrej Karpathy要面對的問題就簡單了:由AI生成的場景能否把特斯拉的自動駕駛訓(xùn)練到L5級別?
如果能,那么一切交給AI自主訓(xùn)練就好,Andrej不需要做什么了。
如果不能,以馬斯克的性格來看, Andrej需要把AI開發(fā)工作交給下一個有能力的人。
——從這個角度來看,無論結(jié)果如何,Andrej都似乎沒有必要留在特斯拉了。
雖然對于Andrej來說他成功把自動駕駛推向了新的高度,但對于整個自動駕駛行業(yè)而言,Andrej的離職無異于一個威力巨大的深水炸彈,如今整個自動駕駛行業(yè)都陷入到巨大的不確定性中:
如果特斯拉的純視覺方案可行,那么國內(nèi)外其他公司就沒有必要在純視覺的技術(shù)路線上追趕特斯拉了——用戶量、數(shù)據(jù)量差的太遠(yuǎn),它們只能尋找其他可行的方案追趕特斯拉。
如果特斯拉的純視覺方案由于不知名的問題受阻,那么意味著整個自動駕駛行業(yè)會面臨一個巨大的困境——自動駕駛的落地將會遙遙無期,資本的耐心也會一點一點損失殆盡。
不管特斯拉能否成功,自動駕駛行業(yè)都需要尋找新的出路。
自動駕駛的出路可能在哪里?
馬斯克已經(jīng)給我們做了極好的示范:當(dāng)一個行業(yè)/領(lǐng)域遇到困難時,可以嘗試從第一性原理出發(fā)思考可能的解決方法,比如方才提到的FSD新方案,就是馬斯克基于第一性原理得出的答案:全世界的道路,是為人類駕駛設(shè)計的,開車的是人而不是機器。
很顯然馬斯克對自動駕駛一貫堅持的觀點是人可以通過兩只眼睛來駕駛車輛,那么機器一定也可以,這才有了依靠純視覺方案依然能吊打用了一堆用雷達(dá)方案友商的特斯拉。
目前自動駕駛似乎花樣繁多,但本質(zhì)上需要解決前面提到過的兩件事:感知和決策。
對于感知而言,機器遇到的最大困難并不是對周圍環(huán)境識別的精準(zhǔn)程度,而是如何才能讓機器理解它感知到的畫面。
目前主流的方案是簡單粗暴給不同物體打上標(biāo)簽,然后再讓AI去訓(xùn)練。
這種方式很明顯只是表層模仿了人類的學(xué)習(xí)方式,這就導(dǎo)致了AI只能依據(jù)圖形的相似情況來判斷物體的種類,然而同一種物體的模樣有千千萬萬,再結(jié)合場景的變化,AI即便訓(xùn)練很長時間,也很難做到100%完全識別。
從更深一層去感知物體的,是用語義地圖的方式。
從人類角度而言,我們通常會對整個圖像進(jìn)行理解,也就是利用上下文信息(context)對整個場景進(jìn)行建模,構(gòu)成了一個場景模型后再進(jìn)行相應(yīng)的處理(碰撞預(yù)警、自動巡航等):
語義識別是通過一個整體去理解局部,在以前傳統(tǒng)的識別車輛,車位線框這些元素的基礎(chǔ)上,再增加諸如墻壁接地線、柱子、行人、懸空物的識別就要比用傳統(tǒng)的算法容易得多。
例如小鵬的VPA停車場記憶泊車功能就采用了這個方案。原因是地下停車場中各種設(shè)施和管路會嚴(yán)重干擾毫米波雷達(dá)的運行,所以在地下停車場中小鵬就不得不采取了近乎純視覺方案的自動駕駛。
但語義地圖仍然是局限在了畫面分割后再識別的模式上,AI并不具備“聯(lián)想”能力。
——同樣一個錐桶,僅僅是轉(zhuǎn)換一個拍攝角度,或微調(diào)一些肉眼無法觀察的像素點,人工智能很有可能就識別失敗,但人類的兒童,卻只需要一張看圖識字的卡片,便能輕易分辨出在路邊的錐桶和人類手拿的錐桶都是同一個東西,但它們代表了不同的含義。
從最本質(zhì)出發(fā),自動駕駛要想達(dá)到L5級別,得先具備和兒童識別物體一樣的能力。也就是說,人工智能模型應(yīng)該可以從 M 個樣本中學(xué)習(xí)到 N 個類別,其中 N 可以遠(yuǎn)遠(yuǎn)大于 M。
人類兒童具備這項能力,本質(zhì)上是從出生一刻開始就在不斷的訓(xùn)練、學(xué)習(xí),學(xué)習(xí)的過程中,不僅僅包括了對各種事物的辨認(rèn),還包括了語言的學(xué)習(xí)——事實上,全世界各地不同人類的思考方式會根據(jù)他(她)所掌握的語言而不同而有不同的思考模式。
那么對于自動駕駛的AI而言,我們可能還需要賦予AI一種“語言”來替代現(xiàn)有的標(biāo)簽去讓AI在進(jìn)行深度學(xué)習(xí)的同時,還兼顧學(xué)習(xí)了這門“用于描述交通的語言”,一旦AI可以用這門語言將物體一一對應(yīng)起來,并自己總結(jié)出交通規(guī)則時,AI或許也能具備融會貫通分辨物體的能力。
事實上在AI領(lǐng)域經(jīng)常提到的“神經(jīng)網(wǎng)絡(luò)”,本質(zhì)上就是模仿了人類大腦中的神經(jīng)元和突觸的作用,因此按照第一性原理來看,讓AI真正掌握人類的某個語言還很困難,但讓AI去真正學(xué)會一套“專門用于交通的語言”是可行的。
感知部分講明白后,決策部分同時也可以直接得到答案。
對于決策而言,機器遇到的最大困難是如何合理、相對準(zhǔn)確預(yù)測參與交通所有對象想做什么,并讓自己參與到其中——特斯拉的做法是不但車有自己的行駛規(guī)劃(plan),也會給路面上每一個參與交通的物體賦予一個行駛規(guī)劃,然后結(jié)合計算后,會讓車選擇風(fēng)險最低的規(guī)劃結(jié)果。
這跟人類的思維模式很像了,但不同之處在于,目前主流的解決方案更多的是按照物體的屬性結(jié)合行動規(guī)律做出的預(yù)測,而如果我們可以讓AI真正學(xué)會一門“交通語言”,那么理論上就可以讓AI同時學(xué)會道路交通中其他參與者的“思考模式”,例如兩輪電瓶車往往會更靈活且遇到障礙物時大多不會看后方是否有來車,反而選擇直接繞行。這時候一個“通曉多種交通工具”的AI,就可以更快地做出更正確的駕駛決策。
但這么做的困難在于其他交通工具,甚至人類本身目前并沒有相同級別的“自動駕駛”方案。
目前從整個行業(yè)來看,看上去指望一家企業(yè)去為每一個交通參與對象都創(chuàng)建一套自動駕駛AI并把它們?nèi)诤掀饋矸浅2滑F(xiàn)實,但其實還是有可能做到的:如果能用數(shù)字孿生(digital twin)技術(shù)創(chuàng)建一個更加真實的虛擬世界,讓多種交通工具,包括行人本身一起在這個世界中進(jìn)行訓(xùn)練,最終一定可以得到一個在決策方面更強的自動駕駛AI。
雖然前面我們一直在說因為Andrej Karpathy從特斯拉的離職造成的蝴蝶效應(yīng),可能會導(dǎo)致自動駕駛行業(yè)需要尋找新的出路,也分析了未來技術(shù)可能的發(fā)展方向。
但對于整個行業(yè)而言,就像人類出生后要先學(xué)會爬,然后才是走,最后才是奔跑一樣,現(xiàn)在要想直接在社會道路上實現(xiàn)自動駕駛對AI來說仍然過于復(fù)雜了。所以一部分車企選擇了在商業(yè)園區(qū)、礦山這樣環(huán)境相對簡單的地區(qū)嘗試落地自動駕駛。
但嘗試一段時間后,無論是園區(qū)還是礦山,都出現(xiàn)了意想不到的問題。
園區(qū)面臨的問題是“走不出去”:如今在園區(qū)自動行駛的車大都是低速自動駕駛,對于快遞車而言還需要為其規(guī)劃專門的停車位,以目前的自動駕駛水平來說,它們很難直接投放到社會上去。
經(jīng)常被大眾認(rèn)為是最容易規(guī)模商業(yè)化的自動駕駛場景之一的礦山場景,雖然不受道路法規(guī)限制,也不存在“走出去”的問題,但存在很多普通大眾完全想不到的現(xiàn)實問題:
保證5G信號覆蓋帶來的網(wǎng)絡(luò)成本、露天礦的生產(chǎn)方式要不停的移動設(shè)備位置、工程車的智能化、多種機械設(shè)備的混編問題、環(huán)境粉塵會影響自動駕駛感知的問題……多如牛毛的問題導(dǎo)致自動駕駛并未能在這個領(lǐng)域落地開花。
雖然這些嘗試讓自動駕駛落地的嘗試都沒有真正成功,但這些落地方式都有一個值得稱贊的共同點,那就是“從場景出發(fā)”。
“場景”是一個使用頻率很高,但在汽車行業(yè)內(nèi)卻是剛剛開始應(yīng)用起來的詞。
傳統(tǒng)汽車確定產(chǎn)品配置的時候,一般是從每一個配置對應(yīng)一個特定功能,再到對應(yīng)用戶的某一個需求出發(fā)來定制產(chǎn)品配置的方式。這種方式在汽車市場上體現(xiàn)的是以部分配置和競品形成差異化的打法,這種打法過去很好用,但在“自動駕駛”這項功能上就失效了。
一方面是要實現(xiàn)自動駕駛所需的配置方案多種多樣,另一方面是除了硬件到位,軟件上的開發(fā)也必不可少,這就導(dǎo)致了在配置表“Feature list”上“智能輔助駕駛”雖然只有寥寥幾項,但它涉及的人力物力并不比造一臺新車少。
——“自動駕駛”可以包含很多的功能應(yīng)用,而要實現(xiàn)這些功能的應(yīng)用,主要取決于用戶使用的場景。如果我們能把用戶的場景盡可能的拆解、細(xì)分之后,就可以先針對某一些場景去開發(fā)對用戶 “真正有用”的自動駕駛功能,比如可以在用戶不舒服的時候讓AI接管,在川流不息的道路上找到合適的機會停車靠邊打雙閃這樣的功能就很實用。
這樣做不但可以在相對短的時間內(nèi)先把自動駕駛這個產(chǎn)品真正落地,從整個市場競爭的角度來看,有了好用的功能,產(chǎn)品的定位也會更清晰。
目前市面上已經(jīng)有不少車企正在做基于細(xì)分場景的自動駕駛開發(fā)了,但都主要集中在了跑高速、自動泊車這兩個場景上(也還不夠好),整體上用戶仍然有很多的真實需求并沒有滿足:
先做地庫全自動行車、泊車場景(有-小鵬汽車、威馬汽車)
先做停車場召喚場景(有-特斯拉)
先做應(yīng)急停車場景(無)
先做高速場景(有-小鵬汽車、蔚來汽車、理想汽車、特斯拉)
先做擁堵跟車場景(無)
先做用戶需要臨時分神的輔助場景(無)
所以從比礦山、物流更細(xì)分、更細(xì)微的場景出發(fā),是自動駕駛落地的一個方向。
雖然我們還不知道Andrej Karpathy接下來會去哪里,但毫無疑問的是,除了特斯拉之外的其他廠商,需要努力為它們的技術(shù)路線尋找到新的落地方向。
在這眾多的方向選擇中,為自動駕駛AI開發(fā)一套專用的語言幫助它們理解世界,并用數(shù)字孿生(digital twin)的方式去讓他們學(xué)習(xí)到所有交通工具甚至人類的行動邏輯,這或許是自動駕駛能真正開始落地的道路。
關(guān)鍵詞: 激光雷達(dá)
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.ffpps.com All Rights Reserved.
中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
国产精品一区二区 尿失禁| 亚洲中文无码卡通动漫野外| 性做久久久久久久| 特级毛片www免费版| 娇妻穿丁字裤公交车被c| 国产suv精品一区二区四| 精品黑人一区二区三区| 久久精品国产亚洲av| 亚洲国产精品无码久久久| 无码永久成人免费视频| 黑人rapper大全 顶级| 久久久久成人精品| 女学生被躁到高潮免费视频| 日本在线观看哔哩哔哩视频| 九色少妇丨porny丨蝌蚪| 亚洲av无码一区二区三区人| 亚洲av无码乱码国产精品久久| 中文字幕精品亚洲无线码二区| 噗嗤噗嗤太深了啊快停下学长| 亚洲精品无码高潮喷水a片软| 国产色在线 | 亚洲| 狠狠久久精品中文字幕无码| CHINESE老熟妇老女人HD| 五个闺蜜的疯狂互换春雨医生| 欧美激情视频| 日韩夜夜高潮夜夜爽无码| 无码人妻精品一区二区蜜桃| 色婷婷丁香五月久久综合| mm131亚洲精品久久安然| 国产午夜影视大全免费观看 | 蜜桃成人无码av在线观看一电影 | 亚洲精品久久久久久| 亚洲AV永久无码老湿机| 我的sm经历1一25章| 97久久久久人妻精品专区| 久久久久免费精品国产| 天天爽夜夜爽人人爽| 亚洲av无码一区二区三区性色| 色一情一乱一伦一区二区三区| 99久久国产福利自产拍| 一女被两男吃奶玩乳尖|