1、負責執行生產系統部署維護工作,包括版本發布管理、變更管理等
2、負責生產系統的日常告警處理、問題跟進、性能分析與優化;
3、響應生產系統突發情況,及時跟進解決異常,完成異常復盤并推動改進方案落地;
4、負責持續優化運維解決方案,包括但不限于生產系統遷移、容災切換演練、應急預案輸出、擴縮容、精細化監控、系統生命周期管理,
5、負責應用系統的相關文檔的編寫及知識庫建設:1、本科以上學歷,4年以上IT行業運維經驗,
2、熟悉 Linux操作系統,熟悉網絡基礎知識,熟悉數據庫基礎知識;
3、熟練掌握各種中間件的部署和使用(比如Nginx、Haproxy、Mysql、Redis、Kafka、Zookeeper等);
4、熟悉常見公共云平臺的使用,如騰訊云、華為云、AWS;
5、熟悉Python、Shell、Per、Go等腳本語言中的一種或多種,熟悉SQL語言,熟練使用腳本來完成日常系統運維工作,
6、熟練使用Docker、K8S、ELK、Ansible等開源棧運維工具;
7、有大規模高發量集群運維管理經驗者優先;
8、有責任感,善于溝通,工作積極主動,樂于持續學習,抗壓性強,良好的客戶服務意識和團隊合作精神
1、shell工作開發、k8s yaml 編排, 了解日常的ci, cd體系;
2、容器集群問題排查, docker了解;
3、sql腳本開發;