職位描述:
(1)參與大模型應(yīng)用場景的技術(shù)方案設(shè)計,結(jié)合具體業(yè)務(wù)提供算法層面的支持,協(xié)助產(chǎn)品團隊定義功能邊界與技術(shù)指標(biāo),推動技術(shù)方案落地。
(2)開展大模型預(yù)訓(xùn)練、微調(diào)策略研究,針對不同任務(wù)場景設(shè)計適配的訓(xùn)練流程,優(yōu)化數(shù)據(jù)篩選、清洗與預(yù)處理方案,提升模型訓(xùn)練效率與效果。
(3)負(fù)責(zé)大模型的性能優(yōu)化,在保證模型精度的前提下,降低模型顯存占用與推理延遲,滿足業(yè)務(wù)端低延遲、高并發(fā)的需求。
(4)協(xié)同多方團隊,明確大模型服務(wù)的接口規(guī)范、數(shù)據(jù)交互格式與性能指標(biāo),推動模型服務(wù)與業(yè)務(wù)系統(tǒng)的無縫集成,確保上線前功能與性能達標(biāo)。
(5)跟蹤大模型領(lǐng)域的技術(shù)動態(tài)與研究成果,推動模型技術(shù)的持續(xù)迭代與創(chuàng)新,實現(xiàn)關(guān)鍵技術(shù)突破。
(6)開展技術(shù)分享與知識沉淀工作,整理大模型研發(fā)過程中的技術(shù)文檔,定期在團隊內(nèi)部進行技術(shù)培訓(xùn)。
任職資格:
1.學(xué)歷要求:碩士研究生及以上學(xué)歷,計算機、人工智能相關(guān)專業(yè)優(yōu)先。
2.工作經(jīng)歷:具備8年以上AI算法工作經(jīng)驗,熟練掌握Python或C/C++,并具有深度學(xué)習(xí)算法相關(guān)經(jīng)驗,了解國內(nèi)外大模型演進及應(yīng)用趨勢,3年以上大模型相關(guān)經(jīng)驗者優(yōu)先。
3.熟悉至少一種深度學(xué)習(xí)框架,如Pytorch、TensorFlow、JAX、PaddlePaddle或MindSpore,熟悉行業(yè)術(shù)語、流程和標(biāo)準(zhǔn),可以提煉出模型真正需要解決的問題。
4. 精通多模態(tài)預(yù)訓(xùn)練模型架構(gòu)設(shè)計開發(fā)、訓(xùn)練優(yōu)化、行業(yè)大模型微調(diào)與知識庫構(gòu)建、領(lǐng)域知識融合、業(yè)務(wù)場景驅(qū)動的模型性能調(diào)優(yōu)及高并發(fā)推理部署。
5.可快速理解業(yè)務(wù)痛點、數(shù)據(jù)特性和價值場景,具備跨行業(yè)知識遷移能力;具有政務(wù)、金融、交通、旅游、能源、電力等垂直行業(yè)工程落地經(jīng)驗者優(yōu)先。
6.具有較強的溝通協(xié)調(diào)能力,面對問題能夠靈活處理;具備較強的學(xué)習(xí)能力,有團隊合作精神與較高的工作熱情。