崗位職責(zé):
1、大模型開發(fā)與性能優(yōu)化:負責(zé)百億至千億參數(shù)規(guī)模的大模型研發(fā),包括架構(gòu)設(shè)計、訓(xùn)練框架搭建、分布式訓(xùn)練優(yōu)化等,提升模型訓(xùn)練效率并降低計算成本。例如,基于PyTorch、DeepSpeed等工具優(yōu)化模型并行策略,解決顯存不足或通信瓶頸問題。同時需探索模型壓縮、剪枝等技術(shù),實現(xiàn)輕量化部署。
2、前沿技術(shù)研究與工程落地跟蹤學(xué)術(shù)界與工業(yè)界最新進展(如Transformer架構(gòu)改進、多模態(tài)融合技術(shù)等),復(fù):現(xiàn)并改進論文中的算法,推動技術(shù)在實際業(yè)務(wù)場景中的應(yīng)用。例如,結(jié)合RAG(檢索增強生成)技術(shù)優(yōu)化垂直領(lǐng)域搜索產(chǎn)品,或通過Fine-tuning技術(shù)適配行業(yè)需求。
3、數(shù)據(jù)處理與系統(tǒng)集成:處理大規(guī)模數(shù)據(jù)集,完成數(shù)據(jù)清洗、特征工程及增強,設(shè)計高效的數(shù)據(jù)管道以支持模型訓(xùn)練。同時負責(zé)模型與生產(chǎn)系統(tǒng)的集成,確保其在分布式環(huán)境中穩(wěn)定運行,并通過監(jiān)控工具實時優(yōu)化性能。
4、跨團隊協(xié)作與技術(shù)支持與算法、產(chǎn)品、運維團隊緊密合作,將:技術(shù)方案轉(zhuǎn)化為可落地的產(chǎn)品功能。例如,為業(yè)務(wù)部門提供API接口或SDK支持,解決模型部署中的技術(shù)難題,并撰寫技術(shù)文檔以促進團隊協(xié)作。
任職要求:
1、碩士及以上學(xué)歷,計算機科學(xué)、人工智能、數(shù)學(xué)或相關(guān)專業(yè)優(yōu)先,重點院?;蚓邆浜M鈱W(xué)術(shù)背景者更具競爭力。
2、精通Python,熟悉PyTorch、TensorFlow等深度學(xué)習(xí)框架,具備CUDA并行計算或分布式訓(xùn)練經(jīng)驗。
3、深入理解NLP、預(yù)訓(xùn)練模型(如GPT、BERT)及多模態(tài)技術(shù),掌握模型微調(diào)、提示工程(Prompt Engineering)等核心方法。
4、熟悉大規(guī)模模型部署工具鏈(如Docker、Kubernetes),了解云計算平臺(AWS、阿里云)及模型服務(wù)化(Model Serving)技術(shù)。
5、需具備3年以上AI研發(fā)經(jīng)驗,主導(dǎo)或參與過千億參數(shù)級別模型的訓(xùn)練與優(yōu)化,有工業(yè)級項目落地經(jīng)驗(如搜索推薦、智能客服等)者優(yōu)先。
6、能快速掌握新技術(shù)(如開源模型DeepSeek-R1),適應(yīng)行業(yè)高速迭代,具備技術(shù)敏感性和創(chuàng)新思維。
7、擅長跨部門溝通,能將復(fù)雜技術(shù)方案轉(zhuǎn)化為非技術(shù)人員可理解的方案,并推動團隊高效執(zhí)行。