1、基于公司業(yè)務(wù)場景,負(fù)責(zé)大規(guī)模方向的研發(fā)工作,包括但不限于NLP、CV及多模態(tài)等領(lǐng)域;
2、深入理解業(yè)務(wù)需求,完成垂直領(lǐng)域大模型精調(diào)與輕量化部署,構(gòu)建Agent應(yīng)用,支撐產(chǎn)品能力需求;
3、參與構(gòu)建高質(zhì)量的數(shù)據(jù)集,基于實(shí)際需求進(jìn)行深入分析以指導(dǎo)后續(xù)改進(jìn)方向;
4、將開發(fā)完成的模型部署到生產(chǎn)環(huán)境中,配合相關(guān)團(tuán)隊完成系統(tǒng)的聯(lián)調(diào)聯(lián)試,確保其穩(wěn)定可靠地運(yùn)行;
5、構(gòu)建和維護(hù)大模型的測試框架,優(yōu)化測試流程,提升測試效率。
6、深入分析測試數(shù)據(jù),提取關(guān)鍵性能指標(biāo),為模型優(yōu)化提供數(shù)據(jù)支持。
7、跟蹤相關(guān)領(lǐng)域技術(shù)動態(tài),撰寫技術(shù)報告,為團(tuán)隊技術(shù)發(fā)展提供建議和支撐
任職要求:
1、擁有計算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)位者優(yōu)先考慮;
2、熟練掌握Python,精通TensorFlow、PyTorch等至少一種主流深度學(xué)習(xí)框架;
3、對機(jī)器學(xué)習(xí)、深度學(xué)習(xí)理論有深刻理解;熟悉NLP或CV領(lǐng)域常用技術(shù)和工具;
4、熟悉大模型SFT訓(xùn)練方法,包括LoRA、P-tuning、Prefix-Tuning等,具有大模型訓(xùn)練、性能調(diào)優(yōu)經(jīng)驗(yàn);
5、了解常用的大模型能力評測Benchmark,對大模型能力評測體系和系統(tǒng)有基本了解;
6、具有垂直領(lǐng)域LangChain、LLaMAIndex、AutoGPT應(yīng)用開發(fā)落地經(jīng)驗(yàn)者優(yōu)先;
7、英文讀寫流利,能夠無障礙閱讀英文文獻(xiàn)資料;
8、具備良好的溝通協(xié)調(diào)能力和團(tuán)隊合作精神,心態(tài)樂觀、積極面對挑戰(zhàn)。