1.參與海量數(shù)據(jù)分析與統(tǒng)計,能夠深入分析現(xiàn)有模型不足,持續(xù)優(yōu)化算法。
2.對技術(shù)有熱情,能夠及時跟進數(shù)據(jù)挖掘,機器學(xué)習(xí)相關(guān)技術(shù)的最前沿技術(shù)發(fā)展,并合理的運用到實際產(chǎn)品。
3.負責(zé)公司的數(shù)據(jù)挖掘、算法設(shè)計和研發(fā)工作,通過數(shù)據(jù)分析、機器學(xué)習(xí)和數(shù)據(jù)挖掘算法發(fā)現(xiàn)業(yè)務(wù)問題和機會點。
4.研究和開發(fā)基于大型語言模型(LLM)、檢索增強生成(RAG)和生成式人工智能(AIGC)的高級應(yīng)用
5.優(yōu)化大模型在不同業(yè)務(wù)場景下的微調(diào)和應(yīng)用,確保模型的準確性和效率。
6.構(gòu)建和維護知識庫,結(jié)合RAG技術(shù),提升問答系統(tǒng)、智能助手等的性能。
7.探索并實現(xiàn)大模型在多模態(tài)、多場景下的應(yīng)用,推動通用人工智能(AGI)的發(fā)展。
8.與咨詢團隊合作,理解并滿足定制化需求,提供端到端的大模型解決方案
1、本科及以上學(xué)歷,計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、人工智能等相關(guān)專業(yè)優(yōu)先考慮。
2、熟悉大模型訓(xùn)練流程以及強化學(xué)習(xí)(RL)算法原理與應(yīng)用,擁有機器學(xué)習(xí)、數(shù)據(jù)挖掘、推薦算法等相關(guān)領(lǐng)域的實際項目經(jīng)驗,能夠獨立承擔(dān)并高效完成項目中的算法設(shè)計與實現(xiàn)任務(wù)。
3、精通至少一種以下編程語言:R、Python、Java、Scala,具備扎實的編程功底和良好的代碼規(guī)范。同時,熟悉 Linux 開發(fā)環(huán)境,能夠熟練運用 Linux 命令進行項目開發(fā)與調(diào)試。
4、熟悉 Hive、Spark 等大數(shù)據(jù)處理技術(shù),能夠運用這些技術(shù)高效處理和分析大規(guī)模數(shù)據(jù)。有機器學(xué)習(xí)和數(shù)據(jù)挖掘等系統(tǒng)的搭建與實施經(jīng)驗,能夠獨立完成系統(tǒng)的架構(gòu)設(shè)計、開發(fā)與部署工作。
5、對大型語言模型、檢索增強生成(RAG)和人工智能生成內(nèi)容(AIGC)有深入理解,具備相關(guān)項目經(jīng)驗者優(yōu)先。
6、熟練掌握至少一種主流深度學(xué)習(xí)框架,如 TensorFlow 或 PyTorch,能夠利用框架快速搭建、訓(xùn)練和優(yōu)化深度學(xué)習(xí)模型。具備使用框架進行模型調(diào)優(yōu)、超參數(shù)調(diào)整的實際經(jīng)驗,能通過實驗和分析不斷提升模型性能,有效解決模型過擬合、欠擬合等問題。
7、擁有將人工智能模型部署到實際生產(chǎn)環(huán)境的經(jīng)驗,熟悉模型部署的常見平臺和工具,如 Docker、Kubernetes 等。能夠根據(jù)實際業(yè)務(wù)需求對模型進行性能優(yōu)化,包括但不限于模型壓縮、量化等操作,確保模型在資源受限的環(huán)境下也能高效運行,滿足業(yè)務(wù)對實時性和準確性的要求。