崗位職責:
1.參與大模型訓(xùn)練框架的開發(fā)和優(yōu)化, 包括但不限于:
參與大規(guī)模分布式訓(xùn)練框架的設(shè)計、開發(fā)和優(yōu)化,提升訓(xùn)練效率和穩(wěn)定性。
參與大模型訓(xùn)練數(shù)據(jù)的預(yù)處理、清洗和增強等工作。
參與大模型訓(xùn)練過程中的性能監(jiān)控、問題排查和調(diào)優(yōu)。
2.參與大模型推理引擎的開發(fā)和優(yōu)化, 包括但不限于:
參與大模型推理引擎的設(shè)計、開發(fā)和優(yōu)化,提升推理速度和效率。
參與大模型壓縮、量化、蒸餾等技術(shù)的研發(fā)和應(yīng)用。
參與大模型在不同硬件平臺上的部署和優(yōu)化。
3.參與大模型相關(guān)工具和平臺的開發(fā), 包括但不限于:
參與大模型訓(xùn)練、推理、評估等工具鏈的開發(fā)。
參與大模型可視化、可解釋性等平臺的開發(fā)。
跟蹤大模型領(lǐng)域的前沿技術(shù), 進行技術(shù)調(diào)研和原型開發(fā)。
任職要求:
1.學(xué)歷要求: 本科及以上學(xué)歷,計算機科學(xué)、軟件工程、人工智能等相關(guān)專業(yè)優(yōu)先。
2.工作經(jīng)驗: 3 年以上相關(guān)工作經(jīng)驗,有大模型開發(fā)經(jīng)驗者優(yōu)先。
3.技能要求:
熟練掌握 Python、C++ 等編程語言,具備良好的代碼風格和文檔習(xí)慣。
熟悉深度學(xué)習(xí)框架,如 PyTorch、TensorFlow 等,了解其底層原理和機制。
熟悉分布式訓(xùn)練、模型壓縮、量化、蒸餾等技術(shù)。
熟悉 Linux 操作系統(tǒng),具備良好的 shell 腳本編寫能力。
具備良好的溝通能力和團隊合作精神。