崗位描述:
1、負(fù)責(zé)大模型訓(xùn)練框架、推理框架及Agent框架的設(shè)計與開發(fā),優(yōu)化模型并行、分布式訓(xùn)練/推理流程
2、針對大模型訓(xùn)練及推理過程,實(shí)現(xiàn)KVCache優(yōu)化、動態(tài)批處理、模型量化/剪枝等技術(shù)
3、主導(dǎo)大模型離線部署、嵌入式部署及異構(gòu)環(huán)境的適配,設(shè)計負(fù)載均衡、資源動態(tài)調(diào)度及異構(gòu)編排方案
4、跟蹤業(yè)界前沿框架技術(shù)(如加速框架、輕量化推理引擎),結(jié)合業(yè)務(wù)需求引入創(chuàng)新方案,解決性能瓶頸
任職資格:
1. 計算機(jī)相關(guān)專業(yè)本科及以上學(xué)歷,碩士及以上或有大規(guī)??蚣荛_發(fā)經(jīng)驗(yàn)者優(yōu)先,2年工作經(jīng)驗(yàn)。
2. 熟練使用Python/C/C++/Golang/Java中的兩項(xiàng),具備扎實(shí)的數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)。
3. 熟悉主流AI框架(PyTorch/TensorFlow等)、大模型框架(Megatron-LM、DeepSpeed等)、推理框架(如 vLLM等)及加速工具(TensorRT等),有深度源碼閱讀和貢獻(xiàn)者優(yōu)先。
4. 具備KVCache優(yōu)化、動態(tài)批處理、模型并行/流水并行等技術(shù)實(shí)踐經(jīng)驗(yàn);
5、理解大模型訓(xùn)練/推理的底層技術(shù)(如Transformer架構(gòu)、分布式訓(xùn)練通信協(xié)議),能針對性能瓶頸設(shè)計優(yōu)化方案;
6、邏輯思維清晰,具備復(fù)雜問題排查能力,能推動復(fù)雜框架從設(shè)計到落地;自驅(qū)力強(qiáng),主動跟蹤前沿技術(shù),樂于分享經(jīng)驗(yàn)并主導(dǎo)技術(shù)方案迭代。