美國國家工程院院士、福特技術研究員 Dimitar Filev : 用于智慧出行的智能車輛系統
當前智能駕駛汽車算法和解決方案面臨的挑戰如下:
1、能學習特定駕駛員和環境、擁有最少的手工標定和標簽數據的車載或者云平臺的實時解決方案;
2、相比較監督式學習更傾向于無監督和半監督強化學習;
3、包含認知信息和物理模型的混合AI算法;
4、AI算法可解釋、可驗證;
5、擁有魯邦特性并且可以自評估;
6、維護成本低。
下面介紹一些有效的解決方案,每當我們遇到一個復雜系統時,我們會努力學習用一些復雜函數去近似這個系統例如神經網絡,這是其中一種方法。另一種方法使用許多簡單的小的子系統進行組合模擬復雜系統。

非監督的演化聚類算法可以實現實時的學習對系統的狀態空間進行預測,一個重要的例子是對引擎特性具有自適應標定和控制能力的在線空時濾波器。混合馬爾科夫模型對于目的地和路徑的預測也是非常有效的。神經網絡的可解釋性是近年來的熱點話題,強化學習可以使用神經網絡將狀態空間映射到行為空間,這是個非線性映射。這種非線性映射可不可以使用其他的映射來近似并且時刻解釋的呢?

基于強化學習的控制器將狀態空間映射到行為空間,而使用模糊控制器基于規則的模型則是一種通用的近似器,通過將強化學習Agent仿真為黑盒子動態系統,它可以被有限級的“if-then”規則近似和解釋。以強化學習車輛跟蹤控制為例,跟車問題基本是是一種自適應巡航問題,后車需要保持與前車的安全距離、控制好各自的車速以及加速度,傳統方法中車速控制器基于吉布斯分布、加速度控制器使用智能駕駛模型(Intelligent Driving Model,IDM)建模,福特使用強化學習,分別建立速度、加速度以及距離的獎勵函數,最大化獎勵函數得到的結果達到甚至超過傳統方法。

在得到加速度結果后,他們使用聚類算法以相對速度和相對距離作為輸入,預測加速度作為輸出,對數據進行聚類來近似強化學習控制器,強化學習器被近似為可解釋的PI控制器的非線性組合的形式,組合系數為各數據點到聚類中心距離負值的Softmax函數。



擬合效果基本達到原始強化學習其的性能,但是推理時間從強化學習器的0.3ms降低到了非線性組合的0.13ms。最后,對演化系統地總結如下:
1、使用演化聚類和核粒化的方法講一個復雜系統實時分解為多個相互重疊的子區域;
2、實時同步學習系統架構以及局部子系統的參數;
3、對具有多個操作模式和多元化行為的系統實時建模;
4、特定的機器學習技巧(無監督聚類與監督學習的組合);
5、反映人類從現實中學習、總結、管理知識的能力。
我們在此提到的演化系統是多個子系統的組合,它的功能非常強大,包含了監督學習方法和非監督學習方法,可應用在實時的無人駕駛大數據處理中。大數據、物聯網以及AI技術的快速發展為智能汽車提供了更多的解決方案,AI算法則需要具備更多的人性化、自適應和最小標定以適應嵌入式實施的需求也很廣泛,智能汽車的發展為傳統AI算法的改進提供了新的發展方向,傳統AI算法應與基于規則的系統、認知知識和基于第一性原理的模型相結合,此外,認知模型對統計機器學習的近似使得傳統機器學習算法變得可解釋和性能的可升。
以上就是我的報告,非常感謝大家
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













