職責(zé)與任務(wù):
監(jiān)控生產(chǎn),主動管理問題,并在最短的時間內(nèi)解決問題
可能的平均恢復(fù)時間(Mean Time to Restore, MTTR),以確保生產(chǎn)環(huán)境SLA的穩(wěn)定性滿足。
?關(guān)注事件、問題、知識和變更實施過程和程序;
對于應(yīng)用程序的運行時質(zhì)量至關(guān)重要。
?協(xié)助管理、監(jiān)控、跟蹤、優(yōu)先排序和更新所有it相關(guān)服務(wù)事件和請求。
調(diào)查干系人的功能性和非功能性需求,并確保他們是可實現(xiàn)的和可能實現(xiàn)的。
?在會議、Slack和AWS上及時了解無線汽車的具體指導(dǎo)方針事件等。
確??捎眯浴⑷萘?、安全性和IT方面的質(zhì)量和持續(xù)改進
應(yīng)用程序的服務(wù)連續(xù)性。
確保遵守約定的交貨時間和績效目標(biāo)。
?根據(jù)確定的業(yè)務(wù)需求,推動變更的實施和持續(xù)改進。
?管理,監(jiān)控,跟蹤,優(yōu)先排序和更新所有it相關(guān)的服務(wù)問題事件
學(xué)歷及工作經(jīng)歷(年):
計算機科學(xué)、計算機工程、數(shù)學(xué)或相關(guān)專業(yè)本科以上學(xué)歷;
2-5年相關(guān)工作經(jīng)驗
具有遠程信息處理解決方案經(jīng)驗者優(yōu)先
需要的能力:
技術(shù)技能
?Linux系統(tǒng)管理知識,精通管理和支持運行在Linux上的復(fù)雜HighAvailability環(huán)境
?數(shù)據(jù)庫(Oracle, MongoDB, PostgreSQL), SQL腳本
?具有亞馬遜網(wǎng)絡(luò)服務(wù)(或類似云提供商)的經(jīng)驗
?具有監(jiān)控云技術(shù)服務(wù)經(jīng)驗(Datadog, Kibana, Grafana等)
?腳本或編程經(jīng)驗(Python等)
?有使用Git或Jenkins的工具和編程語言進行自動化工作的經(jīng)驗
運營和基礎(chǔ)設(shè)施生產(chǎn)支持經(jīng)驗
良好的ITIL, DevOps和敏捷方法理解
軟技能:
較強的問題解決、分析和故障排除能力,并能找到改進的方法
數(shù)據(jù)的可靠性、效率和質(zhì)量。
良好的口頭和書面溝通能力;有傾聽、理解和表達的能力
以適合受眾的方式提供信息
?團隊合作精神
?能夠與同事和客戶建立有效的關(guān)系