“以后的汽車,沒有高階智駕,就沒有競爭力?!苯螘r(shí)間,有不少行業(yè)專家向蓋世汽車表達(dá)了相似的觀點(diǎn)。
從自動泊車到全自動駕駛,從簡單的輔助系統(tǒng)到復(fù)雜的決策算法,智能駕駛已經(jīng)成為衡量一款新車是否先進(jìn)、是否具有吸引力的重要標(biāo)準(zhǔn)之一。對于各大車企而言,加大在智能駕駛領(lǐng)域的研發(fā)投入已成為必然趨勢。
隨著又一屆廣州車展的召開,汽車產(chǎn)業(yè)的最新技術(shù)和趨勢再一次在這里匯聚,各大車企競相展示創(chuàng)新成果,高階智能駕駛技術(shù)的競爭愈發(fā)激烈,端到端和車位到車位等關(guān)鍵詞也站在了新一輪技術(shù)競爭的C位。。
其中,理想汽車展示了其最新的智能駕駛技術(shù)——端到端+VLM雙系統(tǒng)方案。與此同時(shí),理想汽車正式發(fā)布了其車位到車位智駕功能。
借助廣州車展引發(fā)的廣泛關(guān)注,理想汽車近日舉辦了端到端智駕體驗(yàn)日活動。為了更深入地了解這一技術(shù)的實(shí)際應(yīng)用效果,蓋世汽車通過在真實(shí)城市道路的實(shí)際體驗(yàn),對理想“端到端+VLM”加持下的車位到車位功能的真實(shí)能力,做了一次實(shí)地測試。
圖源:理想汽車
“車位到車位”功能實(shí)測
在體驗(yàn)過程中,我們選擇了一段包含多種路況的路線,包括城市狹窄、擁堵路段、環(huán)島、高速公路以及園區(qū)內(nèi)部道路等。就實(shí)際操作而言,用戶只需在車載系統(tǒng)中輸入目的地車位信息,車輛便能夠自動規(guī)劃路線并引導(dǎo)前往。在到達(dá)目的地后,車輛也能夠自動識別并泊入指定的車位。
具體來看,在上車選定導(dǎo)航路線之后,點(diǎn)擊“一鍵智駕”或者跟語音激活,車位到車位的過程就能直接啟動。此后車輛,順利駛出車位、地庫、狹窄的小區(qū)道路,遇到閘機(jī)車輛也會自動停下,等繳費(fèi)抬桿之后繼續(xù)行駛,無需接管。
理想汽車透露,無論是露天停車場、園區(qū)內(nèi),還是多層的地庫、立體停車場,其車位到車位功能都可以支持。
行駛到公共道路上后,智駕系統(tǒng)也可以應(yīng)對環(huán)島、掉頭和各種施工場景,復(fù)雜的博弈和交通燈情況下,通行也較為順暢。
蓋世汽車體驗(yàn)實(shí)錄
這背后的技術(shù)支撐是理想基于端到端+VLM雙系統(tǒng)的智能駕駛方案,簡單來看,端到端不依賴規(guī)則式邏輯,具備更擬人化的駕駛方式,VLM則具備理解物理世界復(fù)雜的交通環(huán)境和中文語義的能力,賦予了智駕車輛更強(qiáng)大的通行能力。
對于U型掉頭功能,理想汽車方面告訴蓋世汽車,端到端基于人類司機(jī)數(shù)據(jù),在不同的掉頭場景中都可以輸出一條合理軌跡,不再強(qiáng)依賴于導(dǎo)航信息和前后車道的拓?fù)溥B接關(guān)系。此外端到端具備更強(qiáng)的側(cè)向感知能力(看得遠(yuǎn)+看得準(zhǔn)),在掉頭過程中,可以更準(zhǔn)確識別和預(yù)測對向直行車輛的行駛軌跡并做出避讓。
蓋世汽車體驗(yàn)實(shí)錄
更值得注意的是理想汽車全國高速收費(fèi)站ETC通行能力,其旨在打通城市與高速駕駛場景。據(jù)理想汽車介紹,該功能不限范圍、無需學(xué)習(xí)過程,全國用戶都能用。
蓋世汽車體驗(yàn)實(shí)錄
理想汽車方面指出:“通過端到端+VLM 架構(gòu),除了讓系統(tǒng)開得像人以外,還能理解真實(shí)世界復(fù)雜的語義信息,在實(shí)現(xiàn)ETC自主通行這個(gè)場景中,也是由VLM識別收費(fèi)站及ETC通道位置,引導(dǎo)端到端系統(tǒng)向ETC通道行駛并通過閘機(jī)。”
此外還有路邊起步、環(huán)島通行等功能,盡管當(dāng)天天氣狀況不佳,道路環(huán)境更加復(fù)雜,在整個(gè)行駛過程中,理想汽車的智能駕駛系統(tǒng)仍然表現(xiàn)出了較高的穩(wěn)定性和準(zhǔn)確性,最終順利泊入預(yù)設(shè)車位。
蓋世汽車體驗(yàn)實(shí)錄
目前,理想基于端到端+VLM的車位到車位功能,已經(jīng)開啟了萬人團(tuán)和全國門店的試駕車的推送,并將于11月底隨OTA 6.5版本車機(jī)系統(tǒng)向AD Max用戶進(jìn)行推送。
快慢雙系統(tǒng)
在過去一年中,理想汽車的智能駕駛技術(shù)經(jīng)歷了快速發(fā)展,從全場景NOA能力的實(shí)現(xiàn),到無圖NOA的推出,再到端到端與VLM技術(shù)的結(jié)合,共完成了三代技術(shù)的迭代。這一過程中,理想汽車在智能駕駛領(lǐng)域的地位和角色發(fā)生了轉(zhuǎn)變。
理想汽車之所以能有如此表現(xiàn),關(guān)鍵在于其創(chuàng)新策略——采用端到端與VLM相結(jié)合的雙系統(tǒng)架構(gòu)方案。
據(jù)理想汽車介紹,基于丹尼爾·卡尼曼在《思考,快與慢》中提出的人類兩套思維系統(tǒng)理論,理想汽車將端到端系統(tǒng)(相當(dāng)于系統(tǒng)1)與視覺語言模型(VLM,相當(dāng)于系統(tǒng)2)融合應(yīng)用于自動駕駛技術(shù)方案中,旨在賦予車端模型更高的性能上限和發(fā)展?jié)摿Α?/p>
其中,系統(tǒng)1,即端到端模型,是一種直覺式、快速反應(yīng)的機(jī)制,它直接從傳感器輸入映射到行駛軌跡輸出,無需中間過程,是One Model一體化的模型。
這種設(shè)計(jì)確保了信息的高效傳遞、推理的高效計(jì)算以及模型的快速迭代能力。
系統(tǒng)1端到端模型的輸入包括攝像頭和激光雷達(dá),通過為英偉達(dá)Orin-X專門優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)主干網(wǎng)絡(luò)提取和融合多傳感器的特征,并投影到BEV空間。
為提升模型的表征能力,理想專門設(shè)計(jì)了記憶模塊,不僅有時(shí)間維度的記憶,還有空間維度的記憶。除了攝像頭和激光雷達(dá),理想還在模型的輸入中加入了車輛狀態(tài)信息和導(dǎo)航信息。最終經(jīng)過Transformer的編碼后,與BEV特征共同解碼出動態(tài)障礙物、道路結(jié)構(gòu)、通用礙物,并規(guī)劃出行車軌跡。
系統(tǒng)2,則是由一個(gè)22億參數(shù)的視覺語言大模型實(shí)現(xiàn),它的輸出給到系統(tǒng)1綜合形成最終的駕駛決策。
理想方面表示,VLM整體的算法架構(gòu)由一個(gè)統(tǒng)一的Transformel模型組成,將提示詞文本進(jìn)行Tokenizer編碼,然后將前視120度和30度相機(jī)的圖像以及導(dǎo)航地圖信息進(jìn)行視覺信息編碼,通過圖文對齊模塊進(jìn)行模態(tài)對齊,統(tǒng)一交給Transformer模型進(jìn)行自回歸推理。
除此之外,理想還運(yùn)用云端世界模型對系統(tǒng)1和系統(tǒng)2進(jìn)行能力的訓(xùn)練和考試,從而使這套系統(tǒng)能夠快速迭代。
理想將視覺語言模型成功部署在車端芯片,意圖使自動駕駛能像人類一樣深刻理解物理世界的復(fù)雜交通環(huán)境和中文語義,并且輔助端到端,解決安全、導(dǎo)航、法規(guī)和舒適等方面的自動駕駛業(yè)內(nèi)難題。
端到端+VLM架構(gòu)已經(jīng)得到越來越多車企和智駕供應(yīng)商的青睞,不過其在自動駕駛領(lǐng)域的應(yīng)用也面臨諸多挑戰(zhàn),并非誰都玩得轉(zhuǎn)。
目前,端到端模型和VLM都需要大量的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練。然而,獲取并標(biāo)注這些數(shù)據(jù)既耗時(shí)又昂貴,且需要確保數(shù)據(jù)的多樣性和代表性,以覆蓋各種駕駛場景和環(huán)境條件。此外,數(shù)據(jù)處理和存儲也是一大挑戰(zhàn),需要高效的算法和硬件支持。端到端+VLM模型的復(fù)雜性,不僅增加了研發(fā)成本,還對車載計(jì)算平臺的算力提出了更高要求。
作為參考,理想汽車的智能駕駛累計(jì)里程已達(dá)26.7億公里,訓(xùn)練算力目前已達(dá)6.83EFLOPS,并且在年底將超過10EFLOPS?;诔?6億公里智駕里程的打磨驗(yàn)證、不斷增長的訓(xùn)練算力以及世界模型在云端的提前部署,理想汽車端到端+VLM智能駕駛系統(tǒng)得以實(shí)現(xiàn)快速迭代。
第一梯隊(duì)的智駕競爭
端到端已經(jīng)成為企業(yè)智駕能力的一道分水嶺,正在從技術(shù)路線之爭進(jìn)入了落地體驗(yàn)之爭,而從頭部智駕企業(yè)的動態(tài)來看,這場落地體驗(yàn)之爭,其核心應(yīng)用之一就是車位到車位。
理想汽車智能駕駛技術(shù)規(guī)劃負(fù)責(zé)人文治宇在接受蓋世汽車采訪時(shí)表示:回顧過去兩年時(shí)間內(nèi),大家的關(guān)注點(diǎn)是去實(shí)現(xiàn)各個(gè)智駕使用場景的功能實(shí)現(xiàn),比如高速NOA、城市NOA等。
“但當(dāng)我們嘗試把它們串聯(lián)起來的時(shí)候,也會發(fā)現(xiàn)之前的一些思路能夠解決部分?jǐn)帱c(diǎn),但解決的方式不夠“優(yōu)雅”或者說面向全國所有的泛化場景,解決效率不夠高?!?/p>
這也是理想和行業(yè)對端到端、“車位到車位”更加關(guān)注的原因之一。
“車位到車位”功能要求自動駕駛系統(tǒng)能夠從指定的起始車位自動行駛到目標(biāo)車位,并在此過程中處理各種復(fù)雜的交通情況和障礙物。這一功能的實(shí)現(xiàn)對于現(xiàn)有的智駕系統(tǒng)來說是一個(gè)巨大的挑戰(zhàn),因?yàn)樗枰到y(tǒng)具備高度的環(huán)境感知、決策規(guī)劃和執(zhí)行控制能力。
端到端技術(shù)在車位到車位的應(yīng)用中發(fā)揮了重要作用。通過端到端技術(shù),車輛可以在沒有預(yù)先設(shè)定路線的情況下,通過實(shí)時(shí)感知周圍環(huán)境和障礙物,自主判斷和規(guī)劃行駛軌跡,從而實(shí)現(xiàn)自動泊車和進(jìn)出車位的功能。這種技術(shù)使得車輛在停車場內(nèi)的操作更加擬人化,能夠更好地適應(yīng)復(fù)雜的環(huán)境變化?。
此屆廣州車展上,多家車企展示了基于端到端的車位到車位功能。
其中小鵬汽車宣布基于小鵬圖靈AI智駕體系,成為行業(yè)首家用一套智駕軟件實(shí)現(xiàn)“車位到車位”的企業(yè)。小鵬的方案以一套軟件邏輯,打通地庫、閘機(jī)、城區(qū)道路等場景,未來將在AI天璣5.5.0上全量推送。
小米汽車也在廣州車展上展示了其“車位到車位”的智駕能力?,按照小米規(guī)劃,從11月16日起,小米的車位到車位智駕功能會開啟定向內(nèi)測邀請,從 12 月底,則會開啟開啟先鋒版推送。
小米汽車方面介紹,后續(xù)推送的“車位到車位”智駕功能,其路線建立過程是完全在后臺自動創(chuàng)建地圖和路徑。比如通勤路線,只要上下班來回,人駕各一次通過停車場,不需要額外任何的引導(dǎo)操作,即可在后臺幫用戶建好停車場地圖。
還有極氪同樣發(fā)布其D2D車位到車位領(lǐng)航輔助功能,預(yù)計(jì)在2025年1月左右分批推送。
“車位到車位”功能正在成為評估端到端性能的關(guān)鍵指標(biāo)之一,某種程度上,車位到車位已經(jīng)成為車企智駕能力的一塊試金石。
近段時(shí)間,有不少車企宣布進(jìn)入智駕第一梯隊(duì),這一隊(duì)伍現(xiàn)在變得越來越擁擠,玩家們也各有自己的拿手好戲,小鵬云端大模型、蔚來NWM世界模型、理想端到端+VLM的雙系統(tǒng)方案等。在新一輪以端到端為核心的智駕競爭中,距離行業(yè)格局穩(wěn)定,距離尚遠(yuǎn)。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關(guān)。僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。