8月31日消息,8月30日,第二十七屆成都國際車展拉開序幕,理想汽車(02015.HK/LI.US)公布了端到端模型、VLM視覺語言模型和世界模型自動駕駛技術架構的最新進展與未來規劃,并宣布基于端到端及VLM視覺語言模型的全新一代理想智能駕駛正式開啟萬人體驗團招募。此外,理想OTA6.2正式全量推送。
理想汽車智能駕駛研發副總裁郎咸朋、智能駕駛高級算法專家詹錕在發布會后接受了包括紅星資本局在內的媒體群訪。
郎咸朋(右)、詹錕(左)
據詹錕介紹,所謂端到端,指的是一種研發的范式,做一個任務,從最開始的輸入端到最后的輸出端,中間沒有其他的過程,用一個模型完整從輸入到輸出。應用到自動駕駛領域,意味著只用一個模型,就能把攝像頭等傳感器收集到的感知信息,轉換成車輛的操作指令。
2023年初,特斯拉(TSLA.US)就提到了端到端。目前多家車企都在卷端到端,但思路與進展各不相同。在詹錕看來,相比模塊化的端到端,一體化(OneModel)端到端是更本質的端到端。
郎咸朋表示,“我們對智駕核心的思路就是端到端+VLM,我們認為這個方式是更接近于人類駕駛更有前途的智能駕駛方案。”
在郎咸朋看來,端到端+VLM技術架構,本質上是人工智能方案。“從現在開始,我們是真正地用人工智能的方式做自動駕駛。”他認為,在這個前提下,自動駕駛研發的核心競爭是是否有更多更好的數據和與之配套的算力去訓練模型,而訓練數據、訓練里程是用錢買不到的。
他透露,理想汽車當前訓練算力達到5.39EFLOPS,預計到2024年底將超過8EFLOPS。理想汽車每年在訓練算力的投入超過10億元人民幣,今年要消耗20億人民幣。“我們認為最終實現自動駕駛需要的訓練算力要達到100EFLOPS的量級,折合成投入每年要超過10億美元。”
對于世界模型,郎咸朋指出,在有監督(L3級別及以下)的自動駕駛上,發揮更大作用的還是端到端模型、VLM視覺語言模型,“因為在有監督的自動駕駛需求下,端到端模型已經足夠用了,VLM只是起到一個提醒輔助的作用”。但是到無監督L4級別自動駕駛之后,這套系統要獨立處理所有的未知場景和突發情況,模型參數量劇增,這時就需要車端的世界模型。
接管率是體現系統能力的核心指標之一。據介紹,理想汽車已經提升到超21公里才接管一次。未來能夠提升到百公里接管一次。不過如果長時間不用接管,人的精神注意力會不集中。理想汽車會通過全新的交互體驗,讓司機在該接管的時候可以做到接管,并通過評測高頻接管的場景地區,提前推送給用戶。
相比友商,理想汽車目前并未對高階智駕收費。郎咸朋強調,標配和免費都是理想從第一天開始進入智能駕駛就制定的策略,有監督的自動駕駛對所有AD Max的車主都是不收費的。“交付量是非常重要的一個衡量指標,對于我們來說不是單純卷交付量,而是還能為自動駕駛提供更多的車輛訓練里程。交付量比較好且企業經營穩健,也有足夠的資源投入智駕研發。”
郎咸朋去年表示,理想汽車的智駕與特斯拉FSD的差距在半年左右,在此次的成都車展上,他表示“今年(雙方的差距)可能還會再小一點”。
他解釋道,第一,從技術架構上,理想汽車跟特斯拉沒有太大差別,甚至更領先一點,“因為我們有VLM,有系統2,特斯拉只是有系統1,端到端”。
第二,在中國的訓練算力和訓練數據上,“至少從現在看我們是領先于特斯拉的,因為特斯拉在數據合規性等方面都受到約束,在中國的訓練算力的部署還需要搭建。在這個層面上看,我們在中國跟特斯拉的差距可能并沒有那么大,我們也特別希望特斯拉能加入進來,互相學習,專注做自身的提升。”