智駕決策規(guī)劃算法工程師/專家(RL方向)-【自動(dòng)駕駛】
40000-70000元
北京
應(yīng)屆畢業(yè)生
本科
北京
應(yīng)屆畢業(yè)生
本科
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
工作職責(zé)
1. 負(fù)責(zé)基于強(qiáng)化學(xué)習(xí)(如Online/Offline RL、Model-based RL)的自動(dòng)駕駛行為決策與運(yùn)動(dòng)規(guī)劃算法研發(fā),重點(diǎn)解決結(jié)構(gòu)化道路(高速、城市快速路)及非結(jié)構(gòu)化場(chǎng)景(自動(dòng)泊車)中的動(dòng)態(tài)交互與博弈問題;
2. 針對(duì)復(fù)雜動(dòng)態(tài)場(chǎng)景(密集車流、無保護(hù)路口、人車混流),設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的決策規(guī)劃算法,通過大規(guī)模分布式訓(xùn)練系統(tǒng)提升策略的智能性、安全性及泛化能力;
3. 構(gòu)建與迭代仿真環(huán)境(如CARLA、NVIDIA Isaac)與世界模型,推動(dòng)強(qiáng)化學(xué)習(xí)策略的仿真訓(xùn)練與實(shí)車遷移(Sim2real),形成“真實(shí)數(shù)據(jù)→仿真訓(xùn)練→實(shí)車驗(yàn)證”的閉環(huán)優(yōu)化;
4. 參與全棧自動(dòng)駕駛決策控制系統(tǒng)的開發(fā),對(duì)接感知、預(yù)測(cè)、端到端模塊,實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的決策規(guī)劃算法在車載平臺(tái)上的部署、性能優(yōu)化與實(shí)車路測(cè);
5. 跟蹤強(qiáng)化學(xué)習(xí)在自動(dòng)駕駛領(lǐng)域的前沿進(jìn)展(如大模型與RL結(jié)合、逆強(qiáng)化學(xué)習(xí)、多智能體博弈),進(jìn)行技術(shù)預(yù)研與算法創(chuàng)新,推動(dòng)研究成果在量產(chǎn)項(xiàng)目中的應(yīng)用與落地。
任職資格
1. 計(jì)算機(jī)科學(xué)、自動(dòng)化、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;
2. 具備扎實(shí)的強(qiáng)化學(xué)習(xí)理論基礎(chǔ),熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一項(xiàng)自動(dòng)駕駛或機(jī)器人項(xiàng)目中具有RL算法落地經(jīng)驗(yàn);
3. 熟練掌握Python/C ,熟悉PyTorch等深度學(xué)習(xí)框架,具備大規(guī)模強(qiáng)化學(xué)習(xí)分布式訓(xùn)練(如Ray、Kubernetes)或仿真平臺(tái)開發(fā)經(jīng)驗(yàn)者優(yōu)先;
4. 熟悉自動(dòng)駕駛決策規(guī)劃常見方法(如MDP/POMDP、搜索與優(yōu)化算法),并能夠?qū)?qiáng)化學(xué)習(xí)與傳統(tǒng)規(guī)劃方法(如MPC、Lattice)結(jié)合解決實(shí)際問題;
5. 具備良好的數(shù)學(xué)基礎(chǔ),熟悉優(yōu)化理論、概率論、車輛動(dòng)力學(xué)建模,能夠支撐RL算法中的獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)、策略優(yōu)化與安全約束處理。
加分項(xiàng):
1. 在NeurIPS、ICLR、ICML、ICRA、CoRL等會(huì)議或期刊發(fā)表過強(qiáng)化學(xué)習(xí)相關(guān)論文;
2. 具備自動(dòng)駕駛量產(chǎn)項(xiàng)目(如NOA、LCC)或L4級(jí)項(xiàng)目(Robotaxi、Robobus)中RL算法集成與調(diào)試經(jīng)驗(yàn);
3. 熟悉仿生學(xué)習(xí)、逆強(qiáng)化學(xué)習(xí)、世界模型等技術(shù),具備數(shù)據(jù)合成、評(píng)測(cè)基準(zhǔn)構(gòu)建或RL訓(xùn)練基礎(chǔ)設(shè)施開發(fā)經(jīng)驗(yàn);
4. 熟悉ROS、Apollo等自動(dòng)駕駛框架,或具備CARLA、Isaac Gym等仿真工具鏈的使用和開發(fā)能力。
工作地點(diǎn)
地址:北京朝陽(yáng)區(qū)北京-朝陽(yáng)區(qū)望京SOHO
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
孫先生HR
上海鈞正網(wǎng)絡(luò)科技有限公司
-
互聯(lián)網(wǎng)·電子商務(wù)
-
1000人以上
-
私營(yíng)·民營(yíng)企業(yè)
-
鼓樓街道
相似職位
-
嵌入式軟件工程師-底層類(工作地:嘉興) 10000-15000元1年以上 本科福建睿能科技股份有限公司
-
網(wǎng)絡(luò)推廣 5000-8000元不限 不限云南升柯網(wǎng)絡(luò)科技有限公司
-
高級(jí)滲透測(cè)試過程師(009641) 面議應(yīng)屆畢業(yè)生 本科昆明南天電腦系統(tǒng)有限公司
-
軟件實(shí)施工程師(昆明)2026屆 面議應(yīng)屆畢業(yè)生 本科廣州海頤軟件有限公司
-
IT運(yùn)維工程師 6000元以下應(yīng)屆畢業(yè)生 大專廣州廣電銀通金融電子科技有限公司
-
測(cè)試技術(shù)員 6000-8000元1年以上 大專江蘇云意電氣股份有限公司

2026-02-27 16:35:22
338人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說是在云南人才網(wǎng)上看到的。
