崗位職責:
1、深入跟蹤調研大模型等AI技術的前沿動態(tài),研究制定AI新技術在本公司相關領域內的實施方案,牽頭推進核心代碼的研發(fā)和實施;
2、深入研究大模型相關的技術,分析不同模型和方案的優(yōu)劣勢,評估最合適的技術方案;熟悉大模型技術解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評測等;利用框架(例如Langchain/LangGraph等)開發(fā)基于大模型的智能體(Agent)和檢索增強生成技術(RAG)相關的產(chǎn)品,參與大模型應用平臺、RAG知識庫平臺等項目落地;使用pretrain、 PEFT、SFT、RLHF 等大模型優(yōu)化技術,深度優(yōu)化場景問題中的大模型效果;使用數(shù)據(jù)去噪、知識增強、知識外掛等技術,緩解或消除業(yè)務應用中的大模型幻覺現(xiàn)象;基于大模型技術構應用服務,解決業(yè)務中的場景問題。
3、根據(jù)大模型場景應用,進行大模型應用平臺的關鍵代碼開發(fā)和系統(tǒng)調優(yōu)。
任職要求:
1.計算機、數(shù)學或統(tǒng)計學相關專業(yè),精通Python、Java等開發(fā)語言,精通 pytorch、tensorflow 等至少1種深度學習框架,具有3年以上 NLP 相關工作經(jīng)驗;
2.熟悉大模型技術解決方案,包括數(shù)據(jù)處理、模型優(yōu)化、數(shù)據(jù)評測等;
3.精通 attention、transformer 及其變型,能熟練應用預訓練、PEFT、SFT、 RLHF 等各種優(yōu)化技術;
4.熟悉業(yè)界領先的大模型系列,包括但不限于Deepseek、GPT、LLaMA、GLM、qwen等,對DeepSpeed、Megatron有一定了解和使用經(jīng)驗;