崗位職責:
1. 前沿算法研究: 主導或深度參與世界級大模型(LLM/VLM)的核心算法創(chuàng)新,包括但不限于架構(gòu)設(shè)計、高效訓練、推理加速、多模態(tài)融合等。
2. 強化學習突破: 深入研究并實踐高級強化學習(RL)技術(shù),特別是大語言模型與強化學習(RLHF, RLAIF等)的結(jié)合與創(chuàng)新,解決復雜序列決策問題。
3. VLA具身智能探索: 開展視覺-語言-動作模型的前沿研究,推動其在機器人、自動駕駛、仿真智能體等領(lǐng)域的應(yīng)用落地,實現(xiàn)從“感知理解”到“物理行動”的跨越。
4. 系統(tǒng)性工程實現(xiàn): 將前沿算法思想轉(zhuǎn)化為高效、穩(wěn)定、可擴展的代碼和系統(tǒng),構(gòu)建我們核心的技術(shù)壁壘。
5. 技術(shù)引領(lǐng): 跟蹤全球最新學術(shù)動態(tài),發(fā)表高水平學術(shù)論文/專利,并參與制定團隊的技術(shù)路線圖。
崗位要求:
1. 學歷背景: 計算機科學、自動化、機械工程、力學、電子工程、應(yīng)用數(shù)學等相關(guān)專業(yè)的博士學位。
2. 研究方向: 博士期間的研究方向至少深度涉及以下一項或多項:
· 大語言模型/多模態(tài)大模型: 在模型預訓練、微調(diào)、對齊、Agent應(yīng)用等方面有扎實的理論基礎(chǔ)和豐富的實踐經(jīng)驗。
· 強化學習: 精通深度強化學習(DRL)經(jīng)典算法,并有在復雜環(huán)境中(如游戲、機器人、仿真等)的成功研究或項目經(jīng)驗。
· 視覺-語言-動作模型: 在VLA、機器人學習、具身智能等領(lǐng)域有深入研究和項目實踐,熟悉相關(guān)的仿真環(huán)境與實驗平臺。
3. 工程能力: 出色的編程能力,熟練掌握Python,并至少精通PyTorch、TensorFlow、Jax等主流深度學習框架之一。
4. 科研素養(yǎng): 具備強烈的探索精神、出色的分析問題和解決問題的能力,以及優(yōu)秀的團隊協(xié)作和溝通能力。