崗位職責(zé)
1、負(fù)責(zé)開展大模型算法研究,包括但不限于:單模態(tài)、多模態(tài)大模型的百卡、千卡訓(xùn)練集群模型預(yù)訓(xùn)練,全參、LoRA、P-Tuning等模型微調(diào),模型輕量化、分布式部署算法,實(shí)現(xiàn)Aoto-GPT,CV,多模態(tài)等最新大模型算法研究與應(yīng)用;
2、負(fù)責(zé)跟蹤最新的技術(shù)發(fā)展和研究成果,提出新的技術(shù)創(chuàng)新和改進(jìn)方案,解決大模型在工業(yè)領(lǐng)域落地問題。
任職要求
1、碩士及以上學(xué)位;
2、熟悉大模型分布式系統(tǒng)研發(fā)體系和多 GPU 優(yōu)化技術(shù)體系,跟蹤和探索面向大模型的分布式優(yōu)化技術(shù)新趨勢;
3、具備大模型的實(shí)際應(yīng)用經(jīng)驗(yàn),對大模型的訓(xùn)練、評估、優(yōu)化以及微調(diào)具備實(shí)際落地經(jīng)驗(yàn),能夠根據(jù)需求進(jìn)行定制化開發(fā)。