centos 开源 微软 云计算 shell Ubuntu Python nginx 编程 程序员 wordpress Firefox apache Windows mysql google Android php linux java

數據中心運維管理經驗39條

今天主要介紹一下有關數據中心運維管理的經驗。

1、空調與機房錯層設計,可以有效防止漏水。

2、機房蓄電池的使用環境溫度非常重要,25度是最佳值。

3、要註意電池的生產批次,講究其一致性,不同批次的產品性能會有略微差異。所以在采購蓄電池時,可以每組同批次的多買2節電池,放入系統中作為電池組的熱備份,當今後某節電池出現問題時,可以及時頂上。

4、要建CMDB,如果沒有建立CMDB庫,那麽一定要建立一本簡單的臺帳,EXECL表就可以。

5、數據中心沒有突發事件,所有事件的發生都應做到預案化。所以要不斷的去完善應急預案,要通過頭腦風暴去設計不同的應急場景。應急管理工作永遠都是在不停的豐富和優化。

6、強調日常工作中預案管理的重要性。

7、應急演練不要總安排在工作日白天,因為白天往往是人力資源最完整的時候,我們演練的一個重要目的是要提高基礎值班人員的響應速度和處理能力,這個初始速度非常重要,很多災難如果響應及時,處理得當,完全可以減輕損失。

8、設備采購談判時一定要談好今後的維保,至少3年。

9、空調系統如果采用全水冷的方式,那麽一定要考慮水壓問題,也一定要確保所在區域不會計劃性停水。

10、為保證供水壓力,可以考慮單獨鋪設水管。

11、ATS要放在母聯的下面……

12、ps並機, 4臺並機比較可靠,超過4臺可靠性就會下降。

13、UPS放電時間要有控制,建議不要超過其剩余容量的30%。

14、UPS間要放備用工具箱,發電機間要有應急照明,主要設備旁要張貼應急處理手冊和故障恢復流程。

15、 UPS中的逆變與旁路要求同步,同步頻率範圍要依據負載來定,要以最小範圍來調。

16、 UPS調試時,旁路與逆變的轉換要多轉幾次。

17、 隔離變壓器的作用之一可以使0地電壓降低,對設備提供保護。

18、UPS輸出切換到旁路的時候,要註意同步燈有沒有亮,同步燈亮就不能強行切換,否則會造成輸出斷電。

19、3相不平衡會導致0地電壓變大,所以基礎設施管理人員一定要嚴格把握,不能隨便亂加負載。(三相不平衡會導致中線電流變大,當大於相線電流時,就會加大零地電壓)

20、先算出電流再選擇線纜。

21、 電池放電到欠壓告警,可以估算出電池的實際可支撐時間。

22、 電池接線,要註意銅和鉛不要直接接確,不然會互相腐蝕,增加電阻,影響電池的放電電壓。

23、UPS至少每半年要檢修一次,要關註UPS風扇,電離和電容都要重點關註。

24、STS要求2路供電的相位和頻率範圍一致,如果來自不同的變電站,可能存在相位、頻率不一致的情況,極端情況下,會造成未端STS無法自動切換。

25、 空調外機要做好標識,尤其是風冷外機,要與內機一一對應,以提高故障判斷和處理的效率。

26、要重視監控數據的分析,風機、壓縮機的運行電流數據可以預判設備的健康情況。

27、機房內的溫度檢測可以同時放在冷通道和熱通道,但監控應以回風溫度為準,所以溫度探測儀要放在回風通道的上方。

28、 空調的加熱裝置不能隨意關閉,系統的自帶功能不要人為隨意幹預。

29、 空調選型時,要選同尺寸內功率最大的。

30、 空調外機清洗要註意安全使用高壓水槍,不能從側面沖洗。

31、制冷劑、機油不同品牌不能混用,否則易造成壓縮機故障。

32、每臺空調內機的支路一定要裝閥門,利於檢修,給水的閥門一定要做好標識。

33、 制冷劑發生泄漏,不要第一時間去搶修,要讓其散發完整,以減少對人體的損害。

34、冷池的頂板起落最好要帶有阻泥,防止突然降落對人身造成傷害。

35、 發電機啟動時要註意空調的瞬時啟動電流,其會導致發電機啟動失敗,最好設置延時,軟啟動。

36、UPS、消防要做到只監不控,否則風險太大。

37、以後可以考慮引入智能列頭櫃。

38、儲能、儲油類系統(如電池、柴油發電機)要當心其二次、三次災害,七氟丙烷是一次性滅火,而不是持續性滅火,遇上電池火災,效果不一定很好。

39、柴油發電機滅火,可以考慮高壓油霧滅火系統。

排風、通風或抽風系統的用電不要接入機房內的配電系統,要獨立,防止機房起火停電後,因排煙、抽風不能用而延緩系統修復速度。

延伸阅读

    评论