有一類新興人才的需求開始在全球出現,不只職位空缺數量開始增加,需求產業也從網絡科技公司逐漸蔓延到金融、零售、高科技製造、媒體,甚至物流業,這就是網站可靠性工程師SRE(Site Reliability Engineering)。
Google在2016年將自家服務維運心法對外公開,打造成一套確保全球性服務高可靠度的SRE維運方法論,還出書大力推廣,不少大型網絡公司或科技公司爭相仿效,SRE成為網絡維運團隊的指標性作法。
隨著數碼轉型浪潮崛起,越來越多企業上雲提供跨國性服務,為了確保自家服務不會中斷,其他產業開始有大型企業使用SRE。2019年,金融業如新加坡星展銀行,或是零售巨頭美國Target,都開始成立自己的SRE團隊,積極導入SRE維運作法或工具。
SRE不是通用型的維運人力資源,而是特別適用於雲端生態環境,提供不中斷雲端服務需求的企業。著重SRE團隊的公司,勢必是大力擁抱雲端生態技術的企業。對網絡公司、科技初創而言,雲端生態技術是本性,隨著服務規模越來越大,也就越有不中斷的需求。例如遊戲業者、網絡服務公司都越來越需要專業SRE維運人才。
這兩年疫情推動了數碼消費,網上商店或網上服務因搶購、塞爆當機事件頻傳,越來越多實體零售業大力發展數碼網絡的同時,開始投放雲端生態技術,也更重視服務的可靠性,SRE就成為他們必須的人才。
對於傳統的大型企業,使用SRE意味著不只展開IT現代化工程,而且更進一步,雲端生態技術成為他們重要的核心技術,推出越來越多數碼化服務或產品,都需要更高可靠性的維護。
SRE方法論中的諸多做法,不問責文化、問題根源分析、SLO服務級別目標、SLI服務水平指標、錯誤預算(Error Budget)等做法,也會隨著越來越多企業推動SRE而開始流行,成為企業IT認真思考採用的新方法。Google每年一度的DevOps調查報告更建議,SRE是DevOps最佳的互補策略,可以讓企業從開發、部署到運作都能更高度自動化。這些做法都會成為IT人在今年的技術增長課題。對IT團隊而言,SRE方法論更貼近業務角度來思考IT系統運作,能讓IT發揮更大的業務影響力和價值。
沒有留言:
發佈留言