崗位職責(zé):
1.負(fù)責(zé)大模型、深度學(xué)習(xí)理論、算法相關(guān)的研究工作;
2.探索大規(guī)模預(yù)訓(xùn)練模型(不限文本、音頻、圖像)的算法研發(fā)和模型訓(xùn)練等相關(guān)工作;
3.探索前沿大模型訓(xùn)練相關(guān)技術(shù)的發(fā)展,包括但不限于算子優(yōu)化, 計(jì)算劃分與調(diào)度、動態(tài)重計(jì)算、流水線優(yōu)化等;
4.研究業(yè)界最前沿的NLP、視覺、多模態(tài)等大模型及相關(guān)工程化工作,解決大模型業(yè)務(wù)落地的事實(shí)可靠性、服務(wù)性能等相關(guān)技術(shù)障礙,形成大模型推理/微調(diào)服務(wù)、AI應(yīng)用工具鏈等平臺化能力;
5.負(fù)責(zé)推動項(xiàng)目中大模型的各種落地應(yīng)用實(shí)施。
職位要求:
1.碩士及以上學(xué)歷,人工智能、計(jì)算機(jī)科學(xué)與技術(shù)等相關(guān)專業(yè) ;
2.具有較強(qiáng)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)相關(guān)技能和算法模型、數(shù)據(jù)挖掘等相關(guān)方向的研究經(jīng)驗(yàn);
3.具有濃厚的前沿新科技探索興趣,具備較強(qiáng)的獨(dú)立分析、解決問題的能力,能獨(dú)立完成科研工作,在國內(nèi)外重要學(xué)術(shù)刊物或重要國際會議(如TPAMI,KDD,NeurIPS,ICML,ICLR,CVPR等)發(fā)表過高水平學(xué)術(shù)論文者優(yōu)先;
4.具有扎實(shí)的數(shù)理基礎(chǔ),對大模型與深度學(xué)習(xí)的基本原理有透徹的理解;
5.熟悉大規(guī)模預(yù)訓(xùn)練模型,有LLM或GPT相關(guān)項(xiàng)目(算法或工程均可)落地經(jīng)驗(yàn)者優(yōu)先。