1、管理各類云產品及系統的所有技術類故障,日常支持包括應急響應、協同調度、復盤改進等故障全生命周期管理,持續優化該管理體系的質量、效率、成本,提升整體服務品質;
2、 負責設計、落地各類云業務的運維保障解決方案,包含但不局限于:線上問題管理、全維度全鏈路的監控管理、線上生產變更管理、故障容災演練管理、大促重大活動管理以及穩定性文化建設;
3、 主導并推進標準運維保障解決方案的落地工作,提升服務效率,實現高效自動化且可擴展的技術服務運行模式;
4.、結合運維保障解決方案及落地經驗,梳理提煉形成云上用戶的標準運維保障解決方案,獨立服務某領域的解決方案設計和建設,并持續化落地優化。
崗位要求:
1、5年及以上數據中心基礎設施運維或設計經驗;
2.、對云計算業務運維保障管理有豐富的實戰經驗,如復雜業務場景下的流程優化和過程改進、系統的高可用性架構實現、組織的穩定性意識提升等;
3、良好的溝通能力及持續學習能力。