職位描述:
1、為部署在大型數(shù)據(jù)中心、AI實驗室和云服務商中的高端計算硬件(如NVIDIA H系列、A系列,或國產(chǎn)算力卡)提供技術支持;
2、需解決從硬件故障、驅動兼容性到大規(guī)模集群性能調(diào)優(yōu)的全棧技術挑戰(zhàn),確??蛻鬉I業(yè)務和科學計算的穩(wěn)定與高效運行;
主要職責:
1、現(xiàn)場技術支持,負責GPU算力卡及其服務器(如DGX/HGX系統(tǒng)、自主品牌AI服務器)的現(xiàn)場部署、上架、調(diào)試及故障診斷(包括硬件更換、固件升級等);
2、快速響應和解決客戶在GPU驅動、容器環(huán)境、深度學習框架和作業(yè)調(diào)度平臺中遇到的技術問題。
任職要求:
1、 計算機科學、電子信息、通信工程或相關專業(yè)本科及以上學歷;
2、深刻理解GPU算力卡(如NVIDIA/AMD/國產(chǎn)芯片)的硬件架構,熟悉其供電、散熱和高速互連(NVLink/NVSwitch)特性,具備服務器硬件級故障診斷能力;
3、領會NVIDIA GPU軟件棧、驅動程序、CUDA Toolkit、cuDNN、TensorRT、NCCL;
4、熟悉Linux操作系統(tǒng)(特別是Ubuntu/CentOS);
5、可適應出差;
6、良好的溝通表達能力;
工作地點:西寧市及其周邊地區(qū)(西寧市湟中區(qū)錦川大道200號中國聯(lián)通三江源綠電智算融合示范園)
職位福利:五險一金、帶薪年假、員工旅游、節(jié)日福利、年終獎 。