1、負(fù)責(zé)AI大模型的適配與開(kāi)優(yōu)化工作,包括模型性能分析與調(diào)優(yōu)、識(shí)別和解決瓶頸問(wèn)題;
2、負(fù)責(zé)AI大模型算子的優(yōu)化和性能調(diào)優(yōu),確保模型在公司硬件平臺(tái)上的高效穩(wěn)定運(yùn)行;
3、負(fù)責(zé)終端大模型部署和解決方案開(kāi)發(fā)及適配,確保AI設(shè)備能夠滿足客戶性能和功能需求
4、深入了解硬件架構(gòu)及底層邏輯,與硬件團(tuán)隊(duì)緊密合作,實(shí)現(xiàn)軟硬件協(xié)同優(yōu)化;
5、跟蹤最新的研究進(jìn)展和技術(shù)趨勢(shì),提出改進(jìn)和創(chuàng)新的想法。
任職要求:
1、計(jì)算機(jī)/通信/數(shù)學(xué) 本科、碩士,3年以上工作經(jīng)驗(yàn)(本)/2年以上工作經(jīng)驗(yàn)(碩士);
2、熟悉計(jì)算機(jī)系統(tǒng)體系架構(gòu),對(duì)軟件性能優(yōu)化加速有深入理解和實(shí)踐經(jīng)驗(yàn)。
3、了解并熟悉AI推理框架(如Onnx runtime\TensorRT等),成功部署過(guò)RNN、DNN、CNN、LTSM等模型且有實(shí)際使用經(jīng)驗(yàn)者優(yōu)先;
4、熟練使用至少一種主流AI框架(如TensorFlow、PyTorch、Mindspore等),并能高效進(jìn)行模型開(kāi)發(fā)與調(diào)試;
5、熟練掌握C/C++、Python編程語(yǔ)言,以及svn/git版本控制、CMake、Makefile等構(gòu)建工具;
6、熟悉國(guó)產(chǎn)GPGPU/NPU及操作系統(tǒng),有國(guó)產(chǎn)平臺(tái)部署大模型應(yīng)用開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先;
7、能獨(dú)立完成售前解決方案,研制方案、研制總結(jié)及用戶使用說(shuō)明書(shū)的編寫(xiě)
8、工作扎實(shí)認(rèn)真,善于與人溝通,具有團(tuán)隊(duì)合作精神。