職位描述
作為研發(fā)團(tuán)隊的實(shí)習(xí)生,您將直接參與大模型相關(guān)的實(shí)驗與研發(fā)工作,協(xié)助算法工程師完成數(shù)
據(jù)處理、模型訓(xùn)練與實(shí)驗復(fù)現(xiàn)。該崗位能夠讓您在真實(shí)的科研與工程場景中積累經(jīng)驗,并有機(jī)
會接觸最前沿的大模型與 RAG 系統(tǒng)應(yīng)用。
主要職責(zé)
1.協(xié)助開展大模型的訓(xùn)練與微調(diào)實(shí)驗,包括實(shí)驗環(huán)境搭建與結(jié)果復(fù)現(xiàn)。
2.參與數(shù)據(jù)收集、清洗、標(biāo)注和預(yù)處理,保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性與完整性。
3.協(xié)助構(gòu)建和維護(hù)訓(xùn)練集、驗證集與評估集,為模型迭代提供支持。
4.編寫實(shí)驗?zāi)_本與工具代碼,提升研發(fā)與測試的自動化程度。
5.撰寫實(shí)驗日志與結(jié)果報告,定期總結(jié)實(shí)驗經(jīng)驗。
6.協(xié)助開展檢索增強(qiáng)生成(RAG)系統(tǒng)的實(shí)驗,測試 embedding、檢索等模塊效果。
職位要求
1.本科或碩士在讀,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)、統(tǒng)計等相關(guān)專業(yè)。
2.熟悉 Python 編程,掌握 NumPy、Pandas 等數(shù)據(jù)處理工具。
3.了解 PyTorch 或 TensorFlow 框架,能夠運(yùn)行基礎(chǔ)實(shí)驗。
4.學(xué)習(xí)能力強(qiáng),能夠快速掌握新技術(shù)。
5.具備團(tuán)隊合作精神與良好的溝通能力。
6.每周可實(shí)習(xí)不少于 4 天,能持續(xù) 3 個月以上。
加分項
1.有科研項目、開源貢獻(xiàn)或算法競賽經(jīng)歷。
2.熟悉 HuggingFace Transformers、LangChain、LlamaIndex 等開源框架。
3.有實(shí)際的大模型微調(diào)、數(shù)據(jù)處理或應(yīng)用開發(fā)經(jīng)驗。
4.在學(xué)術(shù)會議/期刊發(fā)表過論文,或在 GitHub 有相關(guān)項目成果