
智駕網 2023-02-17 09:55
毫末智行:自動駕駛認知大模型正式升級為DriveGPT
毫末構建了自動駕駛決策的獎勵模型(reward model),從而在各種規劃場景情況下做出最優的決策。通過這一大模型,在掉頭、環島等公認的困難場景中,場景通過率提升30%以上。
2月17日消息,毫末智行宣布自動駕駛認知大模型正式升級為DriveGPT,并將在2023年4月的HAOMO AI DAY上公布其最新重要進展。據稱,這是全球首個自動駕駛認知大模型。
隨著ChatGPT火爆全網,它所采用的Transformer大模型以及“人類反饋強化學習(RLHF)”技術再次引發行業關注。在2023年1月的HAOMO AI DAY上,毫末智行CEO顧維灝介紹,毫末推出的人駕自監督認知大模型就已借鑒了ChatGPT的實現思路,采用RLHF(人類反饋強化學習)技術,通過引入真實人駕接管數據,對自動駕駛認知決策模型進行持續優化。
毫末的認知決策算法經歷了三個階段的進化。
第一階段是引入個別場景的端到端模仿學習,直接擬合人駕行為。
第二階段是通過認知大模型,引入海量正常人駕數據,通過Prompt的方式實現認知決策的可控、可解釋。
第三階段,也就是當前階段,通過引入真實接管數據,并且在大模型中開始嘗試使用RLHF算法,對人駕接管數據進行學習。為此,毫末構建了一個包含“舊策略、接管策略、人工label策略”的Pairwise排序模型?;谶@一排序模型,毫末構建了自動駕駛決策的獎勵模型(reward model),從而在各種規劃場景情況下做出最優的決策。通過這一大模型,在掉頭、環島等公認的困難場景中,場景通過率提升30%以上。
目前,毫末DriveGPT已完成模型搭建和第一階段數據的跑通,參數規??蓪薌PT-2的水平。接下來,DriveGPT將持續引入大規模真實接管數據,通過人駕數據反饋的強化學習,來不斷提升測評效果,同時也將DriveGPT作為云端測評模型,用來評估車端小模型的駕駛效果。

x
相關文章
全部
-
梅賽德斯-奔馳2022財年利潤大增28%,2月22日將發布操作系統MB.OS 2023-02-17 18:12
-
激光雷達迎來應用年,車企扎堆競逐城市領航輔助 2023-02-17 17:15
-
寧德時代進軍美國市場遇挫,與福特合作未能實現資本落地 2023-02-15 20:03
熱門文章
-
千尋位置聯合高德發起北斗出行應用創新計劃,普及“車道級導航” 2023-02-19 11:08
-
BMW i3 eDrive40L下線,寶馬沈陽基地實現迎來500萬輛 2023-02-20 10:56
-
智駕公司的新戰場:行泊一體 2023-02-20 11:20