職位描述:
作為研發(fā)團(tuán)隊(duì)的實(shí)習(xí)生,您將直接參與大模型相關(guān)的實(shí)驗(yàn)與研發(fā)工作,協(xié)助算法工程師完成數(shù)
據(jù)處理、模型訓(xùn)練與實(shí)驗(yàn)復(fù)現(xiàn)。該崗位能夠讓您在真實(shí)的科研與工程場景中積累經(jīng)驗(yàn),并有機(jī)
會(huì)接觸最前沿的大模型與 RAG 系統(tǒng)應(yīng)用。
主要職責(zé):
1.協(xié)助開展大模型的訓(xùn)練與微調(diào)實(shí)驗(yàn),包括實(shí)驗(yàn)環(huán)境搭建與結(jié)果復(fù)現(xiàn)。
2.參與數(shù)據(jù)收集、清洗、標(biāo)注和預(yù)處理,保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性與完整性。
3.協(xié)助構(gòu)建和維護(hù)訓(xùn)練集、驗(yàn)證集與評(píng)估集,為模型迭代提供支持。
4.編寫實(shí)驗(yàn)?zāi)_本與工具代碼,提升研發(fā)與測試的自動(dòng)化程度。
5.撰寫實(shí)驗(yàn)日志與結(jié)果報(bào)告,定期總結(jié)實(shí)驗(yàn)經(jīng)驗(yàn)。
6.協(xié)助開展檢索增強(qiáng)生成(RAG)系統(tǒng)的實(shí)驗(yàn),測試 embedding、檢索等模塊效果。
職位要求:
1.本科或碩士在讀,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)等相關(guān)專業(yè)。
2.熟悉 Python 編程,掌握 NumPy、Pandas 等數(shù)據(jù)處理工具。
3.了解 PyTorch 或 TensorFlow 框架,能夠運(yùn)行基礎(chǔ)實(shí)驗(yàn)。
4.學(xué)習(xí)能力強(qiáng),能夠快速掌握新技術(shù)。
5.具備團(tuán)隊(duì)合作精神與良好的溝通能力。
6.每周可實(shí)習(xí)不少于 4 天,能持續(xù) 3 個(gè)月以上。
加分項(xiàng):
1.有科研項(xiàng)目、開源貢獻(xiàn)或算法競賽經(jīng)歷。
2.熟悉 HuggingFace Transformers、LangChain、LlamaIndex 等開源框架。
3.有實(shí)際的大模型微調(diào)、數(shù)據(jù)處理或應(yīng)用開發(fā)經(jīng)驗(yàn)。
4.在學(xué)術(shù)會(huì)議/期刊發(fā)表過論文,或在 GitHub 有相關(guān)項(xiàng)目成果。