崗位職責:
1.負責大規(guī)模預(yù)訓(xùn)練模型(LLM)的設(shè)計、開發(fā)、訓(xùn)練及調(diào)優(yōu),包括架構(gòu)創(chuàng)新、參數(shù)效率提升等 ;
2.負責數(shù)據(jù)處理與工程化,構(gòu)建高質(zhì)量多模態(tài)訓(xùn)練數(shù)據(jù)集,設(shè)計數(shù)據(jù)清洗、增強及標注策略等;
3.負責模型部署與性能優(yōu)化,實現(xiàn)模型的高效推理部署,優(yōu)化GPU/TPU資源利用率,研究模型服務(wù)化方案(如API服務(wù)、邊緣端部署),解決延遲、吞吐量等性能瓶頸;
4.與產(chǎn)品、業(yè)務(wù)團隊深度合作,將技術(shù)能力轉(zhuǎn)化為實際應(yīng)用場景,撰寫技術(shù)文檔、專利及論文,推動團隊技術(shù)影響力。
任職資格:
1. 計算機科學(xué)、軟件工程、數(shù)學(xué)或相關(guān)領(lǐng)域統(tǒng)招本科及以上學(xué)歷;
2. 2年以上算法研發(fā)經(jīng)驗,精通PyTorch框架,且滿足下列條件之一:
- 大模型(10B+參數(shù))訓(xùn)練/微調(diào)實戰(zhàn)經(jīng)驗,深入理解Transformer、注意力機制、RLHF等核心技術(shù),具備模型源碼級調(diào)優(yōu)能力。理解RAG技術(shù)鏈實現(xiàn)邏輯,有自研RAG算法能力;
- 熟悉Megatron-LM、DeepSpeed等分布式訓(xùn)練工具 ,熟練使用CUDA、TensorRT等加速庫,具有模型優(yōu)化部署能力;
- 熟悉計算機視覺領(lǐng)域,有分類/檢測/分割的實際落地項目經(jīng)驗。熟悉傳統(tǒng)圖像算法;
- 熟悉運籌優(yōu)化算法理論,有人員排班/車輛路徑規(guī)劃等項目經(jīng)驗。
3. 熟悉發(fā)明專利的撰寫規(guī)范,有相應(yīng)經(jīng)驗者優(yōu)先。