崗位描述:
1、負責大模型數(shù)據(jù)清洗、大模型訓練微調(diào)、RAG系統(tǒng)開發(fā)、大模型服務(wù)線上部署。熟練掌握主流大模型和多模態(tài)大模型的預(yù)訓練、微調(diào)及部署的細節(jié)和原理。能夠緊密結(jié)合公司應(yīng)用場景,準備相關(guān)數(shù)據(jù),對模型進行針對性微調(diào),提升大模型在垂域場景效果,并在服務(wù)器上部署上線。
2、開發(fā)基于 RAG(檢索增強生成)的多模態(tài)服務(wù)框架,支持文本、圖形、音視頻等模態(tài)的檢索和生成,整合知識庫檢索與模型生成能力,大幅提高生成內(nèi)容的準確性與上下文關(guān)聯(lián)性,為用戶提供更具價值的信息。
構(gòu)建先進的多模態(tài)智能體系統(tǒng),無縫集成知識庫檢索、Agent 工具鏈調(diào)用以及多模態(tài)交互(文本 / 語音 / 圖像)等關(guān)鍵功能,滿足多樣化的業(yè)務(wù)需求。
3、積極探索模型剪枝、量化、知識蒸餾等輕量化技術(shù),有效降低推理成本,提升模型在實際應(yīng)用中的運行效率。
任職資格:
1、統(tǒng)招本科及以上學歷,理工科類專業(yè)背景,計算機、電子工程、自動化、機電相關(guān)專業(yè),3年以上相關(guān)工作經(jīng)驗。
2、熟練掌握 Python 編程語言、常用機器學習框架(如 TensorFlow、PyTorch)和大模型訓練框架(如Fairseq/ms-swift/megatron-lm),能夠運用這些工具進行高效的模型開發(fā)與實驗。
3、掌握 LangChain 、LLamaIndex或Ragflow等RAG框架,熟悉向量庫技術(shù)(如 Milvus、Faiss、Weaviate)和ElasticSearch、Neo4j等相關(guān)工具,基于相關(guān)框架進行開發(fā)集成和功能實現(xiàn)。
4、熟練掌握vllm/llama.cpp/SGLang/lm-deploy等大模型推理框架,具備基于相關(guān)工具進行推理服務(wù)集成能力。有工程化能力和性能優(yōu)化能力。
具有全流程(即大模型數(shù)據(jù)清洗、大模型訓練微調(diào)、RAG系統(tǒng)開發(fā)、大模型服務(wù)部署)的經(jīng)驗。