崗位職責(zé)1. 大語(yǔ)言模型本地化部署與優(yōu)化
- 負(fù)責(zé)DeepSeek-R等大模型的本地化部署,實(shí)現(xiàn)高效GPU資源分配及推理加速方案。
- 開(kāi)發(fā)模型壓縮技術(shù)(量化、剪枝等)及顯存優(yōu)化方案,降低硬件資源消耗。
- 封裝模型服務(wù)API,支持高并發(fā)、低延遲的知識(shí)檢索與生成場(chǎng)景。
2. 知識(shí)庫(kù)數(shù)據(jù)建模與算法開(kāi)發(fā)
- 構(gòu)建知識(shí)抽取算法:基于NLP技術(shù)實(shí)現(xiàn)非結(jié)構(gòu)化文本的實(shí)體關(guān)系抽取、知識(shí)三元組生成及知識(shí)圖譜構(gòu)建。
- 設(shè)計(jì)知識(shí)表示與存儲(chǔ)方案:結(jié)合圖數(shù)據(jù)庫(kù)(Neo4j)與向量數(shù)據(jù)庫(kù)(Milvus)優(yōu)化多模態(tài)知識(shí)存儲(chǔ)結(jié)構(gòu)。
- 開(kāi)發(fā)知識(shí)增強(qiáng)算法:利用RAG(檢索增強(qiáng)生成)技術(shù)提升大模型在垂直領(lǐng)域的準(zhǔn)確性和可解釋性。
3. 數(shù)據(jù)工程與模型訓(xùn)練
- 主導(dǎo)自有數(shù)據(jù)清洗與增強(qiáng):設(shè)計(jì)數(shù)據(jù)標(biāo)注規(guī)則、異常檢測(cè)算法及數(shù)據(jù)增強(qiáng)策略(如對(duì)抗訓(xùn)練)。
- 開(kāi)發(fā)持續(xù)學(xué)習(xí)機(jī)制:結(jié)合主動(dòng)學(xué)習(xí)(Active Learning)優(yōu)化模型迭代效率,降低人工標(biāo)注成本。
- 構(gòu)建自動(dòng)化訓(xùn)練流水線:集成PyTorch/TensorFlow框架,實(shí)現(xiàn)分布式訓(xùn)練與超參數(shù)調(diào)優(yōu)。
4. 系統(tǒng)性能調(diào)優(yōu)與監(jiān)控
- 設(shè)計(jì)模型性能評(píng)估指標(biāo):包括響應(yīng)延遲、知識(shí)召回率、生成內(nèi)容合規(guī)性等。
- 進(jìn)行算法模塊的代碼級(jí)優(yōu)化:通過(guò)CUDA加速、多線程編程提升計(jì)算效率。
- 開(kāi)發(fā)監(jiān)控告警系統(tǒng):實(shí)時(shí)跟蹤模型推理異常(如幻覺(jué)生成、知識(shí)沖突),并實(shí)現(xiàn)自修復(fù)機(jī)制。
任職資格技術(shù)能力
- 學(xué)歷與專業(yè):計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)相關(guān)專業(yè)碩士及以上學(xué)歷,博士?jī)?yōu)先。
- 編程能力:精通Python/C++,熟悉PyTorch/TensorFlow框架,具備CUDA開(kāi)發(fā)經(jīng)驗(yàn)。
- 算法經(jīng)驗(yàn):
- 熟悉大模型微調(diào)技術(shù)(LoRA、P-Tuning)及本地化部署方案。
- 掌握NLP核心技術(shù)(BERT預(yù)訓(xùn)練、文本摘要、實(shí)體鏈接等)。
- 具備知識(shí)圖譜構(gòu)建經(jīng)驗(yàn)(Neo4j、DGL等)。
項(xiàng)目經(jīng)驗(yàn)
- 主導(dǎo)過(guò)知識(shí)庫(kù)系統(tǒng)、問(wèn)答系統(tǒng)或企業(yè)級(jí)搜索項(xiàng)目開(kāi)發(fā)。
- 有處理TB級(jí)結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)的實(shí)戰(zhàn)經(jīng)驗(yàn)。
- 熟悉RAG、向量檢索等增強(qiáng)生成技術(shù)者優(yōu)先。
軟性素質(zhì)
- 具備跨團(tuán)隊(duì)協(xié)作能力,能與產(chǎn)品經(jīng)理、數(shù)據(jù)工程師協(xié)同定義技術(shù)方案。
- 對(duì)AI技術(shù)趨勢(shì)敏感,持續(xù)跟蹤LangChain、LlamaIndex等開(kāi)源工具生態(tài)。
加分項(xiàng)
- 有大型AI產(chǎn)品或項(xiàng)目落地經(jīng)驗(yàn)。
- 熟悉云計(jì)算平臺(tái)(AWS/GCP/Azure)和模型部署(Docker/Kubernetes)。
- 了解生成式AI(如ChatGPT、Diffusion)、大語(yǔ)言模型(LLM)應(yīng)用開(kāi)發(fā)。
- 具有開(kāi)源項(xiàng)目貢獻(xiàn)經(jīng)驗(yàn)或技術(shù)博客。