公司介紹
滴滴于 2016 年組建自動駕駛技術研發(fā)部門,致力于打造世界領先的 L4 級自動駕駛技術,通過科技讓出行更安全、更高效。我們相信,將自動駕駛技術部署在共享出行車隊中,將創(chuàng)造最大的社會價值。依托滴滴在出行領域的 先進技術、海量數據、豐富經驗和完整的出行平臺生態(tài),我們正在打造并運營世界領先的自動駕駛 Robotaxi 車隊,推動自動駕駛在城市復雜交通場景中的規(guī)模化落地。
職位描述
作為感知團隊的一員,你將與國內外頂尖人才一起,研究和開發(fā)自動駕駛領域的前沿算法,直接賦能 L4 Robotaxi 的大規(guī)模部署。
你將面向真實城市道路場景中的多樣化挑戰(zhàn),利用多模態(tài)傳感器(LiDAR、Camera、Radar 等)設計、開發(fā)并優(yōu)化感知算法,解決物體識別、障礙物檢測、場景理解、意圖預測與大模型賦能等核心問題。
在這里,你將有機會:
與中美兩地的優(yōu)秀工程師和科學家合作,參與世界級的技術競爭;
深入研究并推動最前沿的學術成果在產業(yè)中的落地;
在全球最大出行平臺之一的業(yè)務場景中,實現科研成果的規(guī)?;瘧?。
主要方向與職責:
你將在以下方向中選定一個或多個方向深入負責,并承擔從研發(fā)到落地、從算法到系統的端到端職責:
(一)物體識別與跟蹤
設計并實現基于 LiDAR / Camera / Radar 的多模態(tài)檢測模型,識別車輛、行人、自行車、靜態(tài)障礙物、交通標志等
提升精度、召回率與抗擾性(抗遮擋、夜間、惡劣天氣、長尾類別)
(二)通用障礙物識別
識別未知類別 /未訓練類別的障礙物
基于異常檢測 /開放類別識別的算法研究與工程實現
在非結構化環(huán)境(施工區(qū)域、道路損壞、落物等)中提升魯棒性
(三)場景和意圖理解
語義分割、實例分割、道路 /車道/交通標志/交通燈等結構物識別
場景理解,例如施工區(qū)域識別、可通行區(qū)域識別等
意圖理解,例如行人動作識別、起步意圖識別等
交互和事件識別,例如多方交互、交通規(guī)則沖突、非規(guī)范駕駛行為等
(四)感知大模型 /多模態(tài)
探索或應用預訓練多模態(tài)大模型,將視覺、語言、地圖/文本信息融合以增強感知能力
零樣本 / 少樣本 / 跨域泛化的策略研發(fā)
將大模型成果遷移到真實車隊感知系統中,提升復雜場景下的魯棒性
(五)模型評估、驗證
構建完整的評估管道,包括離線評估 + 真實道路 + 模擬環(huán)境測試,支持回歸檢測與性能監(jiān)控
指標體系設計 (Precision, Recall, IoU, latency, false positives rate 等)
基本要求
計算機科學、人工智能、電子工程、機器人等相關專業(yè)碩士及以上學歷(博士優(yōu)先)
扎實的深度學習與計算機視覺基礎,熟悉常見感知算法與前沿研究方向
熟練掌握 PyTorch/TensorFlow 等深度學習框架,具備良好的編程能力(C++/Python)
熟悉 LiDAR、Camera、Radar 等多模態(tài)傳感器感知數據處理
具備良好的論文閱讀能力,能夠快速將前沿研究轉化為工程落地
具備較強的自我驅動、學習能力與團隊協作精神
加分項
在頂級會議/期刊(CVPR、ICCV、NeurIPS、ICLR、RA-L、IROS 等)有發(fā)表經驗
有自動駕駛、機器人感知相關實習或工作經驗
有模型壓縮、實時推理優(yōu)化、異構計算加速等相關經驗
有 VLM、多模態(tài)大模型或生成式 AI 在感知領域的應用研究經驗
工作地點
北京
上海
廣州