工作職責(zé):
1.、搭建與優(yōu)化 CI/CD 流水線,實現(xiàn)前端與后端服務(wù)的持續(xù)集成與交付,加速研發(fā)迭代效率;
2、協(xié)助開發(fā)團隊進行環(huán)境搭建、問題排查與性能調(diào)優(yōu),形成跨部門閉環(huán)支持;
3、設(shè)計并維護系統(tǒng)監(jiān)控、日志采集與告警機制,確保服務(wù)性能、資源利用率與故障響應(yīng)的及時性;
4、參與平臺架構(gòu)優(yōu)化,提出運維層面的改進建議,提升系統(tǒng)可擴展性與自動化程度;
5、編寫并維護相關(guān)技術(shù)文檔,包括運維手冊、部署指南、應(yīng)急預(yù)案等,推動運維體系標(biāo)準(zhǔn)化與自動化;
6、參與監(jiān)控體系建設(shè)、信息安全體系建設(shè)和DevOps工具鏈開發(fā)。
任職要求:
1、本科及以上學(xué)歷,5年以上DevOps/SRE工作經(jīng)驗;
2、深入理解Docker及K8S,Kubernetes使用經(jīng)驗超過3年,Jenkins+Pipeline ClCD運維經(jīng)驗超過3年;
3、熟練運用Linux常用命令,2年以上Python開發(fā)經(jīng)驗,具備較為成熟的工程思想,掌握常用的設(shè)計模式,熟練運用常用的正則表達(dá)式;
4、有阿里云使用經(jīng)驗、熟悉Linux常見發(fā)行版(CentOS6/7、Ubuntu Server、Alpine),熟悉Prometheus/Grafana/APM等監(jiān)控工具,能夠進行相關(guān)配置和數(shù)據(jù)分析;
5、能獨立排查文件系統(tǒng)、網(wǎng)絡(luò)、負(fù)載過高等故障,熟練使用strace、vmstat、top、iftop、iotop等工具;
6、有容災(zāi)備份工程和一定的攻防實戰(zhàn)經(jīng)驗,能夠獨立完成數(shù)據(jù)恢復(fù)工作,與團隊共同完成信息安全體系建設(shè)工作;
7、有較強的自驅(qū)力,對技術(shù)有熱情,學(xué)習(xí)能力強,適應(yīng)能力好,溝通能力強,有一定的抗壓能力。