
當前,數字化轉型已進入深水區。對于數據中心運維管理來說,如何深化應用,并獲得跨越式發展,是企業需要深入思考的問題。
本期大咖說為您分享安超數據中心管理軟件ArcherDCM(以下簡稱安超DCM)如何幫助用戶通過帶外管理的方式對數據中心硬件設備進行全生命周期管理,從而達到簡化運維方式、提升運維效率的目標。
核心內容
1.2013年以來,我國數據中心總體規模快速增長,其中,大型以上數據中心是增長主力,年規模增速約68%,占數據中心總體數量規模近50%。隨著數據中心成為為5G、物聯網、AI等提供有力的基礎設施保障,對設備功耗、運維部署、安全審計等有極高的要求。
2.數字化時代下,數據中心IT設備數量呈現出爆發式增長,人均管理設備臺數由以前的幾十臺,發展到現在的人均幾百甚至更多的設備管理臺數。目前,數據中心管理遇到了人工巡檢、節能要求、資產盤點、遠程運維等挑戰。
3.安超DCM是一款跨廠商、跨平臺的全方位硬件監控平臺軟件,通過帶外的方式實現所有硬件設備的統一管理,實時高效主動地監控硬件設備的狀態,及時發現故障、定位故障,替代人工巡檢,有效的解決人工巡檢發現問題不及時,且需要頻繁進出機房的弊端。
4.安超DCM實現對數據中心硬件設備統一集中管理,從硬件設備實時狀態;設備配置信息自動獲取、部件變更信息自動獲取、維保信息、固件版本管理、機柜空間容量;設備級實時能耗、溫度及遠程管理;遠程管理多個維度實現硬件設備的全生命周期管理,做到設備狀態實時可查、可知、可追蹤、可視化管理。
5.安超DCM主要擁有四個功能,包括無人值守、能耗管理、資產管理、遠程管理。無人值守方面,不需要人工去做巡檢,只要坐在辦公室,就可以看到哪一個機房里的哪個機架上的哪一個U位上的哪一個設備里的哪一個部件,發生了什么樣的問題,可以清晰的去定位他的故障。同時在定位故障的同時還進行自動化的提示。比如硬盤預警功能,能夠提早發現問題,把故障扼殺在搖籃里。
6.能耗管理功能主要就是通過帶外管理的方式去獲取我們設備的事實的功率。在機房層面,安超DCM對機房機構實時空間容量、能耗數據進行統計,實時統一展現機房空間、電力資源使用情況、運行狀態,確保機房用電安全,有效預防因電壓不足而導致硬件設備宕機問題。在機柜層面,安超DCM自動采集X86服務器實時功率、溫度,無需增加硬件設施,實現各機柜能耗數據精準收集。對機柜電力負荷進行實時統計與自動報警。在設備層面,安超DCM支持實時采集服務器進風口溫度。通過進風口溫度,主動發現過載服務器、僵尸服務器,根據策略進行負載優化。
7.資產管理功能,能夠從采購到上線到管理再到下線,實現全生命周期的追蹤管理。這個功能能夠幫助用用戶實現設備從采購、安裝使用,再到運維、報廢的全過程服務。并對監測數據進行分析、管理,為日常運營提供支持。
8.遠程管理功能就是遠程的KVM的功能。這個功能可以幫助用戶實現無需進出機房,遠程管理異地多機房。支持開機、關機、重啟操作,實現數據中心異構設備的遠程控制。
9.安超DCM是通過帶外管理口的方式,能夠對跨品牌、全類型硬件進行全生命周期自動化運維和可視化展現的數據中心管理平臺。在設備層,實現對計算資源、網絡資源、存儲資源、動環、安防等設備進行跨品牌、跨平臺的統一監控。在數據采集層,支持主動采集(SNMP、SSH、HTTPS、CLI)、被動采集(SNMPTrap、Syslog)與第三方系統數據整合等多種數據采集手段。在數據處理層,實現對設備硬件狀態的實時分析:資產分析、故障分析、能耗數據、空間數據,等等。在展現層:支持在統一的Portal界面展現設備的運行情況、告警等信息。支持分級分權限管理,運維人員只看自己關注的信息。
10.目前,安超DCM已經支持了政 府、金融、證券等眾多用戶有效減少繁瑣、重復、費時的各項運維工作,保障數據中心設備安全、穩定運行,同時降低數據中心運營成本,實現節能增效、無人值守、綠色環保、安全的AI數據中心,全面為數字化轉型保駕護航。