虛擬化使數(shù)據(jù)中心網(wǎng)絡(luò)監(jiān)控變得復(fù)雜
無論管理員是在數(shù)據(jù)中心大樓內(nèi)還是在幾英里外的地方工作,都必須配置一套有效的警報(bào)機(jī)制。你不能只是設(shè)想恰巧有人走進(jìn)數(shù)據(jù)中心并注意到控制臺(tái)屏幕上顯示了一個(gè)即將出現(xiàn)的問題。這就是為什么確保有一個(gè)良好的網(wǎng)絡(luò)管理和監(jiān)控方案是如此重要的原因所在。如果沒有,那可能只有當(dāng)報(bào)警鈴聲響起時(shí)我們才會(huì)意識(shí)到出了問題。
需要監(jiān)控什么?
數(shù)據(jù)中心有很多不同的東西需要監(jiān)控,因此我們需要制定大量的數(shù)據(jù)中心監(jiān)控規(guī)劃。有些人很可能認(rèn)為數(shù)據(jù)中心監(jiān)控就是一直密切地觀察服務(wù)器的運(yùn)行,但實(shí)際操作要復(fù)雜得多。
除了服務(wù)器操作系統(tǒng)和應(yīng)用程序之外,還有很多其它的因素需要我們進(jìn)行監(jiān)控。比如,對數(shù)據(jù)中心溫度的觀察也很重要。大多數(shù)服務(wù)器都配有內(nèi)置安全機(jī)制,當(dāng)服務(wù)器的溫度超出某個(gè)特定值并且可能損壞服務(wù)器時(shí),它就會(huì)讓服務(wù)器停機(jī)。一個(gè)好的監(jiān)控解決方案必須能夠及時(shí)報(bào)告數(shù)據(jù)中心環(huán)境的溫度,同時(shí)還應(yīng)該能夠在任何一臺(tái)服務(wù)器的溫度開始接近臨界水平時(shí)向我們發(fā)出警報(bào)。
電源管理方面的情況也是類似的。當(dāng)發(fā)生電源中斷時(shí),通常來講備用電源會(huì)保持服務(wù)器在預(yù)先設(shè)定的時(shí)間范圍內(nèi)正常運(yùn)行。更加復(fù)雜的數(shù)據(jù)中心也可能會(huì)依賴備用發(fā)電機(jī)。在任何情況下,我們都必須關(guān)注能源中斷現(xiàn)象,我們也必須知道在任意給定時(shí)間中需要多少備用電源。
一個(gè)好的監(jiān)控解決方案必須能夠提醒我們關(guān)注服務(wù)器硬件問題、操作系統(tǒng)故障、應(yīng)用故障、網(wǎng)絡(luò)硬件故障和環(huán)境問題。這可以說是一個(gè)苛刻的要求,同時(shí)這也是為什么說適當(dāng)?shù)囊?guī)劃至關(guān)重要的原因之一。據(jù)我所知,沒有一個(gè)監(jiān)控解決方案可以同時(shí)執(zhí)行所有這些功能。一般來講,網(wǎng)絡(luò)架構(gòu)師需要同時(shí)購置幾種監(jiān)控解決方案,并且將它們都安裝在系統(tǒng)上以發(fā)揮警報(bào)作用。這個(gè)警報(bào)可以以文本信息的形式發(fā)送到管理員的移動(dòng)通信設(shè)備上,或者以郵件的形式發(fā)送到服務(wù)臺(tái),或是以其它警報(bào)形式提醒管理員。重要的一點(diǎn)是所有的警報(bào)最終都必須被匯集到一個(gè)地方。
虛擬化技術(shù)使數(shù)據(jù)中心網(wǎng)絡(luò)監(jiān)控變得復(fù)雜化
當(dāng)我們采購監(jiān)控解決方案時(shí),我們必須銘記這其中有許多因素需要考慮,比如說虛擬化,它會(huì)使監(jiān)控過程變得復(fù)雜化。例如,市場上有各種不同的可以監(jiān)控服務(wù)器硬件失效信號(hào)的監(jiān)控應(yīng)用軟件。諸如此類的應(yīng)用可以監(jiān)控到過高的服務(wù)器溫度、SMART磁盤警報(bào)、甚至是服務(wù)器制冷電扇的失效。但問題在于,如果監(jiān)控解決方案并不知道它是在監(jiān)控一臺(tái)虛擬服務(wù)器,它可能就無法監(jiān)控到會(huì)潛在影響服務(wù)器可用性的硬件問題。
監(jiān)控軟件應(yīng)該可以找出主機(jī)服務(wù)器硬件的問題。但是,當(dāng)主機(jī)存在風(fēng)險(xiǎn)時(shí),任何運(yùn)行在主機(jī)上的虛擬機(jī)有可能也會(huì)存在風(fēng)險(xiǎn)。因此,當(dāng)使用虛擬機(jī)時(shí),我們需要有一種方法來區(qū)分物理服務(wù)器和虛擬服務(wù)器,并且知道哪些虛擬機(jī)是在哪些主機(jī)服務(wù)器上運(yùn)行。同時(shí),當(dāng)發(fā)生硬件問題時(shí),我們還必須能夠快速地將客戶機(jī)轉(zhuǎn)移到其它主機(jī)服務(wù)器上。
最后要說的是,管理和監(jiān)控是同步進(jìn)行的。只有管理能力到位才可以實(shí)現(xiàn)良好的監(jiān)控,特別是當(dāng)員工不在現(xiàn)場工作的情況下。例如,當(dāng)管理人員無法及時(shí)到達(dá)出現(xiàn)故障的服務(wù)器來阻止事故發(fā)生,如果監(jiān)測軟件可以告知我們將有重大故障出現(xiàn),這該有多好?這就是說能夠監(jiān)控每臺(tái)數(shù)據(jù)中心服務(wù)器和硬件核心部件并與它們實(shí)現(xiàn)遠(yuǎn)程交互是如此重要的原因所在。
責(zé)任編輯:何健
-
曹志剛:我們期待風(fēng)電成為中國的主力能源
2020-11-17風(fēng)電,能源,主力能源 -
張鈞:未來配電網(wǎng)內(nèi)涵特征與發(fā)展框架研究
-
習(xí)近平:持續(xù)增強(qiáng)電力裝備、新能源等領(lǐng)域的全產(chǎn)業(yè)鏈優(yōu)勢
2020-11-02電力裝備,新能源,通信設(shè)備
-
曹志剛:我們期待風(fēng)電成為中國的主力能源
2020-11-17風(fēng)電,能源,主力能源 -
張鈞:未來配電網(wǎng)內(nèi)涵特征與發(fā)展框架研究
-
杜祥琬:創(chuàng)新觀念,推動(dòng)能源高質(zhì)量發(fā)展
2020-09-28能源,創(chuàng)新,觀點(diǎn)