前沿科技,數(shù)智經(jīng)濟
文|劉俊宏
編|王一粟
2025 剛開年,智能汽車今年競爭的主旋律便已經(jīng)定調(diào)。隨著武漢、北京等城市即將允許 L3 自動駕駛上路,卷了一年高階智駕落地的玩家們終于到了 " 決戰(zhàn)時刻 "。
面對這場競爭,理想汽車(下簡稱 " 理想 ")選擇率先出手。
1 月 16 日,理想汽車全量推送了 OTA7.0 版本車機系統(tǒng),并將高階智駕升級到 AD Max V13.0 版本。與特斯拉的 " 期貨 " 不同,理想已經(jīng)給車主們準備好了擁有 800 萬 clips 訓(xùn)練數(shù)據(jù)、無限接近零接管、全場景端到端、車位到車位 " 絲滑無斷點 " 的智駕體驗。
值得注意的是,此次明確的智駕版本號,背后是理想要讓用戶更好感知智能駕駛變化的決心。事實上,自理想 OTA 5.0 切換 BEV 架構(gòu),上線城市 NOA 以來,理想內(nèi)部就啟用了 AD Max 的獨立版本號進行管理。如今的 V13.0 版本,意味著過去一年理想共完成了 12 次 AD Max 重大更新。并且后續(xù) AD Max 版本號也將按照產(chǎn)品的更新及優(yōu)化進行版本號迭代和維護。
政策的松口、無限接近 " 零接管 " 智駕的落地,意味著一個新的高階智能駕駛的時代已經(jīng)到來。
在智駕落地的壓力下,車企和智駕供應(yīng)商們開始 " 著急 " 起來。其中,奧迪和廣汽全面抱上了華為的 " 大腿 ";比亞迪宣稱要在智能化方面投入 1000 億;地平線新推出了智駕掉頭和園區(qū)漫游功能。
就在智能汽車玩家們狂卷智駕能力的節(jié)點上。理想汽車 CEO 李想?yún)s在 2024 年 12 月 25 日 -27 日連續(xù)的三天理想 AI Talk 中,再次強調(diào)理想汽車將成為一家全球領(lǐng)先的人工智能企業(yè)。
為何理想要在汽車智能化競爭最激烈的時刻認為 AI 比汽車更重要?背后或許是李想洞察到公司落地 AI 所取得的成果。
聚焦產(chǎn)品層面,理想在 2024 年實現(xiàn)了汽車智能化從追趕、持平到領(lǐng)先的追越。在智駕上,理想僅用了 3 個月便完成了無圖 NOA 到端到端 +VLM 智能駕駛的迭代。在技術(shù)的迭代下,消費者也形成了理想 = 智駕的認知。
統(tǒng)計數(shù)據(jù)顯示,截至 2024 年 12 月 31 日,理想 NOA 導(dǎo)航智能駕駛里程已占智駕里程的 70%。同時,在理想產(chǎn)品最主要的 30 萬及以上的價格段內(nèi),AD Max(智駕頂配版)的交付量超過 75%。
" 增強我的能力、成為我的助手、成為我的硅基家人 "。
隨著用戶對智駕逐漸依賴,李想也看到了一條 AI 連接物理世界和數(shù)字世界的道路。AI 以汽車作為載體,為用戶提供越來越豐富的服務(wù)和價值。或許在李想看來,未來 Robotaxi 提供的服務(wù)還是過于 " 冰冷 ",有人情味的 " 車和家 " 才是更接近智能汽車產(chǎn)品的第一性。
為了實現(xiàn) AI 能更懂人類的夢想,據(jù)理想汽車數(shù)據(jù)顯示,每年投入上百億元研發(fā),有近 50% 用于投入 AI。在大模型這邊,李想也提出了公司要在未來幾年內(nèi)把大語言模型的基座模型做到行業(yè)前三的要求。如此,在視頻(VLM)大模型的結(jié)合下,懂視覺和語言的 AI,最終將徹底理解這個世界。
在 2024 年完成智駕趕超的理想,能實現(xiàn)李想宏大的 AI 理想嗎?
L3 智駕,理想準備好了
" 下半年如果我還看不到變化,理想智駕拿不到頭部位置的話,那你這個負責人就可以不用干了。" 回憶起 2024 年初李想對智駕落地的督促,理想汽車自動駕駛研發(fā)副總裁郎咸朋至今都倍感壓力。
在李想看來,理想汽車是否能順利落地高階智駕,已經(jīng)到了影響 " 生死存亡 " 的地步。
而在此之前的 2023 年,郎咸朋帶領(lǐng)的團隊和國內(nèi)大多數(shù)的智駕公司一樣,一直在嘗試用規(guī)則的方式解決 Corner case(邊界情況),就是出一個問題,寫一個代碼去解決。這導(dǎo)致理想汽車在 2023 年落地高階智駕的節(jié)奏整體偏慢。
2024 年上半年,高階智駕已經(jīng)成為消費者選車考慮的重要因素。根據(jù)工業(yè)和信息化部披露的數(shù)據(jù)顯示,中國乘用車 L2 級輔助駕駛及以上新車滲透率達 55.7%,其中具備領(lǐng)航輔助駕駛(NOA)功能的新車滲透率達到 11%。
換句話說,是理想產(chǎn)品主打的 30 萬及以上的價格段內(nèi)(在整體車市的銷量占比大概為 15% 左右),消費者已經(jīng)形成了標配高階智駕的共識。
事實上,理想智駕起步的目標非常高。早在 2023 年 4 月的上海車展,理想汽車就喊出了城市 NOA 落地 100 城的目標。但半年過后,這個目標就縮水為 " 在 100 城開通通勤 NOA"。2024 年初,李想帶隊前往美國體驗特斯拉 FSD,隨后理想的智駕才開始轉(zhuǎn)向無圖 NOA。
此時,各路智駕供應(yīng)商們,開始向車企兜售無圖 NOA 解決方案。同時,由于 AI 大模型的催化,智駕技術(shù)領(lǐng)先的玩家們也都開始了初步 " 端到端 " 的探索。
" 還是回歸產(chǎn)品和用戶體驗上,而不是追求指標的領(lǐng)先。" 誠如郎咸朋所說,在與李想達成智駕研發(fā)要用 " 端到端 " 技術(shù)和注重體驗的共識之后,2024 年 4 月開始,理想的智駕能力 " 直線起飛 "。
以 OTA 大版本為節(jié)點,在 2024 年 5 月,理想智駕主要還是聚焦在場景細節(jié)調(diào)優(yōu)。從 7 月的 6.0 版本更新無圖 NOA 開始,理想智駕開始更注重功能和體驗。
作為佐證,理想在 2024 年 8 月更新的車位隨心畫功能,智駕能夠理解用戶的停車意圖,想停哪里就停哪里。離車泊入功能也升級到了關(guān)門泊入,在用戶對理想智駕的信任下,用戶自動泊車再也不需要掏手機控制了。
10 月,理想智駕更新至 " 端到端 +VLM 智能駕駛 " 后,理想的智駕能力再一次飛躍式提升。光錐智能在實際體驗之后,發(fā)現(xiàn)這個版本的智駕不僅能順利通過環(huán)島。而且在無保護右轉(zhuǎn)時,不會向其他廠商的智駕一樣,還需要 " 踩一腳剎車 "。
參考理想用戶社區(qū) @仟仟爸爸的分享,理想智駕能夠輕松面對環(huán)島 + 突然加塞 + 變道繞行的復(fù)雜操作。用戶全程只是吐槽了一下加塞車輛,然后用 " 也行 ",點評了一下變道操作。
如今,隨著已經(jīng)推送的 AD Max V13.0 更新,可以預(yù)見,理想智駕在復(fù)雜的中國道路可以實現(xiàn) " 零接管 "。這也是符合自動駕駛 L3 標準的表現(xiàn)。
消費者也開始逐漸信任智駕,并愿意為此買單:" 買理想就買智駕版 ",成了消費者的共識。
李想曾經(jīng)在采訪中對光錐智能透露,2024 年上半年,理想曾經(jīng)有幾個月被問界的銷量壓制的很難受,但在智駕能力上升后,理想的銷售們都能挺起腰桿讓消費者 " 隨便對比 ",而后,理想的銷量也隨之打了一個漂亮的翻身仗。
根據(jù)理想統(tǒng)計的數(shù)據(jù)顯示,截至 2024 年 12 月 31 日,NOA 導(dǎo)航智能駕駛里程已占智駕里程的 70%。這意味著,NOA 已經(jīng)替代了原先大量輔助駕駛的使用,類似 LCC(車道居中保持)等功能,正在 " 撤離 " 用戶心智。另一邊,在端到端全量推送一周內(nèi),理想注意到有 3600 位之前從未在城市使用 NOA 的車主開始每天使用該功能。并且,這些用戶每天的導(dǎo)航里程提升了兩倍,這意味著用戶已經(jīng)相當依賴智駕了。
在銷售端,理想智駕也已經(jīng)成了潛在客戶最重要的購車原因之一。據(jù)統(tǒng)計,截至 12 月 31 日,理想 NOA 試駕占比超 72%。30 萬以上車型 AD Max 交付量占比超 75%,40 萬以上車型 AD Max 交付量占比超 84%。這樣的銷量構(gòu)成,意味著消費者幾乎是因為理想智駕而選購理想汽車。
可以看到,在智駕經(jīng)歷不到一年的迭代中,理想不僅實現(xiàn)了智駕跨越式升級,還更新了品牌的消費者認知。如今的理想,已經(jīng)從此前 " 冰箱、彩電、沙發(fā) " 的標簽,切換到了智駕(AI)實力派。
為何理想的 AI 進展能如此之快?
或許正如李想與郎咸朋在討論智駕方向時所言," 要么做端到端,要么別做自動駕駛了 "。在 AI 時代,選對路徑比一味的努力更重要。
對標 " 人 "
理想智駕的第一性原理
在人類研究 AI 的 60 余年里,科學(xué)家們得到次數(shù)最多的教訓(xùn)便是方向比努力更重要。
以 AI 大模型的基礎(chǔ)架構(gòu) Transformer 為例,雖然谷歌的科學(xué)家在 8 年前提出了 Transformer,但谷歌在研究方向的猶豫,讓 OpenAI 率先完成了 ChatGPT,顛覆了谷歌此前在 NLP 領(lǐng)域不少心血。
同樣的感慨,也發(fā)生在理想轉(zhuǎn)向 " 端到端 " 之后。
" 比之前所有車的狀態(tài)都要好,剎車非常擬人舒適,這些問題在規(guī)則階段用很多代碼都沒辦法解決。" 在采用端到端僅僅 15 天之后,看到新技術(shù)架構(gòu)對過去的顛覆,郎咸朋不禁驚嘆道。而實現(xiàn)這種差異的過程,理想智駕算法研發(fā)部門負責人賈鵬總結(jié)說:" 一行規(guī)則都沒寫,全是系統(tǒng)按照給的數(shù)據(jù)訓(xùn)練出來的。"
回顧理想的三次智駕技術(shù)變遷,從 NPN(先驗信息)到無圖 NOA,再到如今的端到端 +VLM 雙系統(tǒng)架構(gòu),每一代都在根本上顛覆了上一代的設(shè)計架構(gòu)。
其中,無圖 NOA 為了替代 NPN 必須的先驗信息(一般是指高精地圖),智駕系統(tǒng)強化了感知和規(guī)劃模塊,將智駕從原本的 " 開卷答題 " 轉(zhuǎn)向到 " 閉卷作答 "。端到端對無圖 NOA 的提升,主要在于端到端用 AI 學(xué)習(xí)取代了無圖 NOA 的人力編寫規(guī)則模塊,相當于原本智駕 " 背公式 " 轉(zhuǎn)向到 " 隨機應(yīng)變 "。
由此看到,設(shè)計更好的 AI 架構(gòu),智駕也更接近實現(xiàn)全自動駕駛。
理想?yún)⒖剂巳祟愡壿嬎季S中的下意識反應(yīng)和深思熟慮,將整個智駕系統(tǒng)拆解成了 " 快慢 " 雙系統(tǒng)(對應(yīng)系統(tǒng)一和系統(tǒng)二)。
其中,系統(tǒng)一是完全的端到端架構(gòu)。智駕模仿人類面對正常路況的操作,這時候控制車輛 " 加減速 " 不需要思考太多。系統(tǒng)二則是在端到端的基礎(chǔ)上,理想 " 外接 " 了一個多模態(tài)大模型(VLM)。利用多模態(tài)大模型對圖片、文字等信息的理解能力,系統(tǒng)二能為系統(tǒng)一提供真實世界的認知。
為何理想的架構(gòu)與市面上玩家都不同,既不是特斯拉用單個端到端模型 " 暴力破解 " 人類操作,也不是小鵬、華為、蔚來等分段式端到端的路線?
因為,這么設(shè)計能帶來更快的智駕迭代速度。
具體而言,是端到端部分負責快速學(xué)習(xí)投喂的 clips(視頻片段)。通過對人類操作的模仿,智駕系統(tǒng)能快速學(xué)到與 " 老司機 " 近似的操作水平。
" 我們起初投喂 80 萬 clips 的時候,還過不了環(huán)島。后來當數(shù)據(jù)量達到 100 萬 clips 時,他自己就能過環(huán)島了。我覺得是 100 萬 clips 里頭剛好有一些環(huán)島數(shù)據(jù)的原因。模型確實很神奇,你喂了什么數(shù)據(jù),他就能學(xué)會相應(yīng)能力。" 賈鵬解釋說。
另一邊,借助能理解真實世界信息的 VLM,整個智駕系統(tǒng)還能方便投入到世界模型中參與 " 考試 ",從而實現(xiàn)針對能力訓(xùn)練和模擬智駕在 Corner case 中的表現(xiàn)。" 我們還會根據(jù)所有的數(shù)據(jù)生成 " 模擬題 ",針對模型容易出問題的部分,再生成一些內(nèi)容訓(xùn)練。" 郎咸朋說。
理想富有創(chuàng)意的架構(gòu)設(shè)計,一經(jīng)發(fā)布便斬獲行業(yè)內(nèi)多個獎項。2024 年,理想智能駕駛的 DiVE(世界模型)及 StreetGaussians(世界模型)發(fā)表在了 ECCV 2024 上,DriveVLM(雙系統(tǒng))發(fā)表在了 CoRL 2024 上,獲得行業(yè)的一致認可。
總之,面向 2025 年即將推廣的 L3 自動駕駛,坐擁 110.9 萬用戶、智駕總里程累計達 29.3 億公里、800 萬 clips 投喂、8.1EFLOPS 訓(xùn)練算力,并且每年訓(xùn)練算力的投入超過 10 億人民幣(以上數(shù)據(jù)截至 2024 年 12 月 31 日)的理想,已經(jīng)做好了十足的準備。
隨著理想對智駕的深入研究,其 AI 基礎(chǔ)能力也在快速升級。
其中,為了在芯片層繼續(xù)優(yōu)化智駕能力,理想即將流片自己專用的智駕 SoC。原本用于座艙助手的理想同學(xué),現(xiàn)在也登陸手機,對標 ChatGPT、豆包等通用智能體。在汽車 AI 能理解人類之后,李想也開始考慮起人工智能的下一個形態(tài)——機器人。
汽車之外,理想要用 AI 做更多產(chǎn)品了。
李想的理想
打通硅基世界
理想汽車至今的成功,背后離不開李想頂級的產(chǎn)品能力。
細細復(fù)盤李想的每次創(chuàng)業(yè),都能看到他以 " 超級產(chǎn)品經(jīng)理 " 的姿態(tài),對每個行業(yè)的高舉高打。每次切入一個新賽道,李想都能看到行業(yè)最根本的發(fā)展主線。
例如,2005 創(chuàng)立汽車之家時,李想看到了中國消費者巨大的汽車消費潛力,但缺乏了解渠道的困境。為了滿足消費者對汽車產(chǎn)品的好奇,汽車之家主打汽車評測,一舉打敗了主做車友會的愛卡汽車網(wǎng)。
2015 年創(chuàng)立理想汽車時,李想看到的是中國汽車在電動化和智能化存在機遇,同時傳統(tǒng)汽車供應(yīng)鏈早已成熟的情況。為了在最低限度打造一款智能汽車,李想盡可能采用成熟的技術(shù)和設(shè)計。避免了里程焦慮、空間不夠、不舒適等新能源汽車常見問題的理想 ONE,開賣即爆款。
在 AI 大模型時代剛剛開始的 2023 年初,看到 ChatGPT 的橫空出世,李想在 1 月發(fā)布的全員信中提到,公司將在 2030 年成為全球領(lǐng)先的人工智能企業(yè)。隨后在李想的號召下,理想快速跟上了行業(yè)每一個 AI 落地的風口,AI 從隱藏戰(zhàn)略變成了 " 陽謀 "。
"AI 意味著未來的全部。" 誠如李想在 2024 年 12 月的理想 AI Talk 上對 AI 的看法。隨著理想對 AI 的落地,李想也慢慢看到了 AI 應(yīng)用更廣袤的視野。
在智艙領(lǐng)域,是理想為了追趕大語言模型的熱度,2023 年一季度理想開始了 Mind GPT 項目,并在 2023 年 6 月的理想家庭科技日發(fā)布會上發(fā)布。2023 年年底,Mind GPT 隨著 OTA 5.0 上車,跟上了行業(yè)用大語言模型提升車機智能化的趨勢。如今,結(jié)合 VLM 對視覺世界的理解,理想 " 摸到 " 了 AI 融合的邊界。
" 基座模型到一定時刻,一定會變成 VLA(視覺語言行動模型,可以理解成真正能理解世界的智能)。因為語言模型,也要通過語言和認知去理解三維的世界。" 正如李想所說,隨著 AI 對世界愈發(fā)理解,語言、圖片、生成、硬件的邊界即將被打破。
" 一個真正的大模型產(chǎn)品,一定是能夠去自主使用所有的設(shè)備,會擁有所有的服務(wù),這才是真正的人工智能。" 正如李想所言,AI 產(chǎn)品的核心邏輯其實與智駕一模一樣。
都是從小范圍、標準化的場景出發(fā),到逐漸適應(yīng)更多場景,為客戶提供更多樣的服務(wù)。最終打破硬件的壁壘,同一個 AI 能同時落地到全場景的智能硬件。換句話說,能聽懂指令并能自覺執(zhí)行任務(wù)的機器人,何嘗又不是一種帶著乘客 " 逛街 " 的自動駕駛呢?
" 普通老百姓都能用了,它能獨立地、持續(xù)地、連續(xù)地完成任務(wù),而不需要靠密集的提示詞。" 李想說。
或許,在 AI 即將大范圍落地端側(cè)的 2025 年里,李想看到了 AI 終將打通硅基世界的未來。
光錐智能"AI 交流群 "已建立,
感興趣的朋友可以添加小助手微信(GZZN2019)溝通進群。
聯(lián)系我們
王一粟
創(chuàng)始人 / 主編
ID:cishicike000
※添加時請備注公司 + 姓名 + 來意