shell nginx Firefox java linux google wordpress 微软 mysql php Android 云计算 Python 程序员 centos Ubuntu 编程 开源 Windows apache

高效運維之運維2.0:危機前的自我拯救

這篇是《中生代》轉載的一個關於運維的文章。作者是觸控科技運維總監蕭田國。文章在運維圈子流傳甚廣。特別也發在社區,分享給感興趣的朋友。


d28c174235e28a9f37c34a089d85db434c7067e2

前言

運維的今天,內憂外患。運維危機,已非盛世危言、或嘩眾取寵。

怎麽辦?暴風雨和奇點同時逼近,而運維的分化,或許只是時間的問題。

為此,我提出新觀點:運維2.0——這也是運維最後的機會。

運維好比是池塘裏的魚,不管水域大小,都有一塊自留地。但某天,突然來了一頭鯨魚,目標不是魚而是水…… 所以運維的任務需隨之而變——在水被吸幹之前,提前上岸。

運維2.0,就是那個帶我們跳出池塘投身大湖的武器。

挑戰究竟何等兇猛?技術重要性不斷下沈,新的核心競爭力何在?趨勢不可逆轉的話,怎麽升級到運維2.0?且聽本文分解。

本文不是很長,依慣例放上目錄,請享用:

1.什麽是運維2.0
2.為什麽需要運維2.0
    2.1 公司內部的各種不滿
    2.2 公有雲風起雲湧
    2.3 開源軟件百花齊放
    2.4 運維自動化
3.運維2.0的落地
    3.1 技術服務業務
    3.2 能力雙模式
    3.3 開放的技巧
4.擁抱變化
結語

好吧,我們正式開始。


1. 什麽是運維2.0?

運維2.0是指可依賴、懂業務、服務化的專業運維(或稱服務運維)。也是本專欄所推崇高效運維的抽象和概括,即“專業、熱情、方便、快”。

需要引起註意的是,技術不代表專業。相反,技術往往是專業的最大障礙。

運維2.0要求,從技術運維升級為服務運維,向公司提供可依賴的專業服務。

運維2.0強調服務交付能力,而不是技術能力。這也要求我們完成角色轉換,成為懂業務的運維。具體而言,需要完成如下兩個轉換。

1)轉換工作重心:從關註工作產能(技術的自我修養),變成關註工作產出(我們為公司做出多大貢獻);

2)轉換關註重心:從關註自我評價,變成關註外部評價。


2. 為什麽需要運維2.0?

伴隨著Web 2.0的風潮,近年來,運維相關技術的發展也突飛猛進。

但同時,從內部來看,對運維的不滿,日益突出;從外部來看,公有雲來勢兇猛,開源軟件百花齊放,自動化運維降低了對人的依賴——眾多運維人員,逐漸從技術的創造者(手藝人)淪為技術的使用者(裝配員)。


2.1 公司內部的各種不滿

對運維而言,來自內部各種不滿的聲音,從來就沒消停過,而且越演越烈。從調查來看,貌似很少有公司對運維是相對比較滿意的。

公司內部的典型不滿,包括如下圖所示種種。不知其中是否有大家的影子?最終公司和業務部門就像圖中間這只小貓,抓心撓肺卻又無可奈何。

運維本來就是個尷尬的行當。公司默認,不出故障是正常的。甚至有公司將開發、測試和運維並列,起評分為零分,每出一次故障,扣幾分。

運維覺得自己的苦憋有多少,業務部門對運維的不爽就同等的有多少。

公司內部的不滿,是運維危機的主要根源之一。

公司和業務部門長期積累的負面情緒,已積累多年,遲早有一天會突然爆發。曾經有公司老板,在某一次運維嚴重人為事故後,準備把整個運維部端掉;類似情況也發生在另一家公司出現嚴重的安全事故時。


2.2 公有雲風起雲湧

根據RightScale對國外930家公司在2015年第一季度的調查來看,目前93%的公司已經在使用雲,其中公有雲的使用者為88%。如果包括傳統企業,國內使用雲的比例可能低些,但整體趨勢已經非常明顯。

IaaS幹掉了基礎運維,公司不再需要人各地出差服務器上架了,機房值班更加不需要了。

PaaS部分幹掉了應用運維,甚至技術含量高的DBA,需求量都將銳減。

SaaS甚至幹掉連研發都幹掉了,使得公有雲的使用更加傻瓜化,像Office 365,誰不會呢?

有人甚至提出OaaS——服務器運維的外包,也就是說,徹底不需要運維部門了。


2.3 開源軟件百花齊放

開源軟件從來沒有像今天這樣生機勃勃。隨之,運維人員從技術的創造者淪為技術的使用者——好比調制雞尾酒,能力的高低,取決於勾兌水平,但還都能喝。

不僅國外新的開源技術層出不窮,國內互聯網公司也發布了諸多令人驚艷的作品,甚至包括之前大家認為相關封閉的大公司,近來也改變姿勢,主動推出自家各種得意之作。

國內新晉大公司甚至規定:能用開源軟件,就不自主研發。並且樂於成為開源軟件的committer,反饋並回報社區。開源軟件降低了相應系統運維的復雜度和技術要求,也即降低了對人的依賴。

前些年,精通Shell腳本編程的系統工程師,相比工資可能高出50%。但隨著Puppet、SaltStack等開源軟件的出現,使得各個系統組件偏於積木化,操作也更加簡便高效。


2.4 運維自動化

運維進化到今天,已非刀耕火種的時代。各種開源軟件就好比武器和工具,使得運維自動化的實現,變得如此地得心應手、遊刃有余。只是,這會導致中級水平運維人員的需求銳減。

站在運維制高點的大公司,已經向我們傳送陣陣涼意——山雨欲來風滿樓。

某大型互聯網公司,實現了遊戲自動化運維的PaaS平臺,通過簡單的頁面操作,可以完成新服、更新、合服、數據分析等幾乎所有業務需求。這使得,在公司業務量增加50%的情況下,運維人員僅增加了5%。

另外,運維自動化已深入運維的各個細分工種中,而不僅限於應用運維和系統運維。某大型互聯網公司,持續改進IDC自動化平臺,使得服務器交付時間縮短為不到6%,網絡設備交付時間縮短為不到15%。

某大型互聯網公司,基於多年技術積澱,基本實現了數據庫自動化運維。這使得單個DBA能維護的數據庫服務器,增加10倍,然後呢……

或許不用太長時間,這股風潮將席卷盤踞山腰的中型公司,然後以暴風雨的形式,落在中小公司頭上。


內憂外患!內外交困!新形勢下,運維的價值何在?技術重要性不斷下沈,還準備倚仗某些壓箱底的技術活呢?迷失的運維,出路在何方?運維的前途會怎樣?我們能平安上岸麽?

3. 運維2.0的落地

運維2.0是一個理論+實踐的體系,內容較多,本文僅擇要提及。關於如何落地的具體細節,我會在本專欄的系列文章中分別闡述。

運維2.0不是忽視技術,而是強調技術得適度,把我們的關註點從技術本身,轉移到貢獻上來。技術服務業務,與此同時,再搭配各種理論及方法技巧。

誠如前文所言,運維2.0即高效運維,亦即:專業、熱情、方便、快。也就是說,向公司交付一種可依賴的專業服務。其中“專業”的意思,包括減少故障發生次數,縮短故障時長(有公司甚至進一步提出,“不以故障多為恥,以恢復快為榮”),少犯人為事故,個人技術進步服從業務要求(少搞自研、多用開源)等。

另外,“熱情、方便、快”見之前專欄文章,本文不做贅述。

運維2.0的實現,基於產出/產能平衡原則,只有完成如下三大類產能的投入,才會最終獲得心儀的產出——運維2.0。需要註意的是,這三大類投入,並非串行,相反,應同時修煉。

相信會有那一天,公司業務部門驚喜地說,“我們運維變化好大”。


3.1 技術服務業務

我們的諸多行為背後都有動機(潛意識),這就是俗稱的思維模式。我們不自知的是,往往不自覺地陷入各種思維模式(思維陷阱)中。在這些既定思維模式中,我們感覺到舒服,更難以體認到思維模式是可以改變的。

我們需要提升意識。就像這三個石匠的故事。

這個故事是如此的直白而又精準,我們仿佛看到管理學科創始人彼得·德魯克在講述時,不無揶揄的表情。是啊,對公司業務而言,我們都是石匠,或者說鑿石頭的;而且,新的鑿石神器已經在路上……

為什麽技術服務業務?運維不是銷售,無法對公司產生直接價值(收入),我們的工作價值是通過外部門間接實現的。說得再直白些,我們本質上提供的是一種“服務”,僅此而已。

我們屬於服務業(多麽痛地領悟),需要深知技術只是我們的工具,僅此而已。


3.2 開啟能力雙模式

這裏的能力,包括業務能力和技術能力。

我們需要主動學習業務,主動、定期和業務部門溝通,業務部門感受到我們的誠意後,也會釋放他們的誠意,這樣便有了愉快的工作環境,業務能力也會提升地更快。

我們需要主動擁抱公有雲及新興的開源軟件,樂於分享,而不是把某些技術當做壓箱底、保命的資本。


3.3 開放的技巧

技巧同樣非常重要,除去在本專欄第01篇和第02篇講述的那些之外,例如恰當的鼓勵、及時的正向反饋,也往往能取得意料之外的效果。不要再潛意識地覺得自家領導、外部門都是白癡,都無可救藥。真誠地、平等的交流、傾聽,改變遲早會來。


備註:運維2.0的部分主張,參見本專欄文章的01和02篇。因篇幅所限,運維2.0更多的各種細節,本篇暫且不表。以後本專欄還會有多篇文章,詳細闡述。敬請關註


4. 擁抱變化

其實,我們有什麽理由相信,自己就是那個獨善其身的幸運者?——在我們看到互聯網幹掉一個又一個傳統行業,而運維實際還處於初級階段的時候。

同樣,運維的進化,將導致中級運維人員的需求銳減,更多需要初級運維和高級運維(即工具的操作者和工具的建設者)。

這需要我們修煉新技能:從外部審視自己,懂業務,提升專業服務能力,樹立公有雲無法替代的優勢。與此同時,加強技術能力,提升為高級運維人員,以實現提前上岸的目標。因為運維的集約化,使得高端技術人才的需求更大。例如,像航天這種高度自動化的行業,飛機駕駛員就是一個高大上的崗位。

諸多開源軟件需要二次開發,因此學些編程,成長為DevOPS或全棧工程師,也是一個好的選擇。

Q&A

【問】我確實沒怎感覺到運維危機?你怎麽說服我著手實踐運維2.0呢?

【答】運維危機不因你個人是否感覺到,而不存在嘛。至少,咱也得居安思危,對不?況且實施運維2.0,又不會讓自己損失什麽,早些總比晚些好。這就好比考駕照,覺得自己暫時不買車,就不去考。等有一天所在城市準備限號,那就哭都來不及了(駕照是排號的前提)。

【問】我修煉了運維2.0,可公司不需要那麽多人了,咋辦?
【答】你的綜合技能大大提升,都已內外兼修,還怕找不到更好的工作?

【問】看完你的文章,整個人的心情都不好了。能否說說運維的機遇?
【答】抱歉,請相信我這些文字只是善意提醒。而且,我對運維感情很深,十多年一直奮鬥在這個行當。機遇在於,很多公司開始減少成見,並越來越重視運維。現狀越是糟糕,改善越是能獲得更高評價。運維2.0可幫助大家快速地提升軟實力,實現飛越。


結語

暴風雨和奇點必將來臨,區別只是時間上,早一些或晚一些。運維2.0,將重新定義運維。要求公司內部運維部門,從側重“技術運維”升級到“服務運維”。這也是在變革時代中,運維重生的最後機會。

運維2.0,要求運維從內而外的改造自己,這個過程痛苦,但也是我們唯一的機會,這甚至決定著我們是生存、還是死亡。

焦慮和恐慌不能解決問題,對事實和趨勢的抗拒,頂多自欺欺人,對解決問題也沒有任何幫助。認同趨勢,順應潮流,提前做好準備。

 

延伸阅读

    评论