教你排除網(wǎng)絡交換機故障教程
教你排除網(wǎng)絡交換機故障教程
一、交換機故障分類:
交換機故障一般可以分為硬件故障和軟件故障兩大類。硬件故障主要指交換機電源、背板、模塊、端口等部件的故障,可以分為以下幾類。
(1)電源故障:
由于外部供電不穩(wěn)定,或者電源線路老化或者雷擊等原因?qū)е码娫磽p壞或者風扇停止,從而不能正常工作。由于電源緣故而導致機內(nèi)其他部件損壞的事情也經(jīng)常發(fā)生。
如果面板上的POWER指示燈是綠色的,就表示是正常的;如果該指示燈滅了,則說明交換機沒有正常供電。這類問題很容易發(fā)現(xiàn),也很容易解決,同時也是最容易預防的。
針對這類故障,首先應該做好外部電源的供應工作,一般通過引入獨立的電力線來提供獨立的電源,并添加穩(wěn)壓器來避免瞬間高壓或低壓現(xiàn)象。如果條件允許,可 以添加UPS(不間斷電源)來保證交換機的正常供電,有的UPS提供穩(wěn)壓功能,而有的沒有,選擇時要注意。在機房內(nèi)設置專業(yè)的避雷措施,來避免雷電對交換 機的傷害。現(xiàn)在有很多做避雷工程的專業(yè)公司,實施網(wǎng)絡布線時可以考慮。
(2)端口故障:
這是最常見的硬件故障,無論 是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時一定要小心。如果不小心把光纖插頭弄臟,可能導致光纖端口污染而不能正常通信。我們經(jīng)常看到很多人喜 歡帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了端口的故障發(fā)生率。在搬運時不小心,也可能導致端口物理損壞。如果購買的水晶頭尺寸偏大,插入 交換機時,也容易破壞端口。此外,如果接在端口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會導致所連交換機端口被擊壞,或者造成更加不可預 料的損傷。
一般情況下,端口故障是某一個或者幾個端口損壞。所以,在排除了端口所連計算機的故障后,可以通過更換所連端口,來判斷其是否損壞。遇到此類故障,可以在電源關閉后,用酒精棉球清洗端口。如果端口確實被損壞,那就只能更換端口了。
(3)模塊故障:
交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴展模塊等。這些模塊發(fā)生故障的機率很小,不過一旦出現(xiàn)問題,就會遭受巨大的經(jīng)濟損失。如果插拔模塊時不小心,或者搬運交換機時受到碰撞,或者電源不穩(wěn)定等情況,都可能導致此類故障的發(fā)生。
當然上面提到的這3個模塊都有外部接口,比較容易辨認,有的還可以通過模塊上的指示燈來辨別故障。比如:堆疊模塊上有一個扁平的梯形端口,或者有的交換 機上是一個類似于USB的接口。管理模塊上有一個CONSOLE口,用于和網(wǎng)管計算機建立連接,方便管理。如果擴展模塊是光纖連接的話,會有一對光纖接 口。
在排除此類故障時,首先確保交換機及模塊的電源正常供應,然后檢查各個模塊是否插在正確的位置上,最后檢查連接模塊的線纜是否正 常。在連接管理模塊時,還要考慮它是否采用規(guī)定的連接速率,是否有奇偶校驗,是否有數(shù)據(jù)流控制等因素。連接擴展模塊時,需要檢查是否匹配通信模式,比如: 使用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有一個,那就是應當立即聯(lián)系供應商給以更換。
(4)背板故障:
交換機的各個模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導致機內(nèi)溫度升高,指使元器件燒壞。
在外部電源正常供電的情況下,如果交換機的各個內(nèi)部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況即使是電器維修工程師,恐怕也無計可施,惟一的辦法就是更換背板了。
(5)線纜故障:
其實這類故障從理論上講,不屬于交換機本身的故障,但在實際使用中,電纜故障經(jīng)常導致交換機系統(tǒng)或端口不能正常工作,所以這里也把這類故障歸入交換機硬 件故障。比如接頭接插不緊,線纜制作時順序排列錯誤或者不規(guī)范,線纜連接時應該用交叉線卻使用了直連線,光纜中的兩根光纖交錯連接,錯誤的線路連接導致網(wǎng) 絡環(huán)路等。
教你排除網(wǎng)絡交換機故障教程
從上面的幾種硬件故障來看,機房環(huán)境不佳極易導致各種硬件故障,所以我們在建設機房時,必須先做好防雷接地及供電電源、室內(nèi)溫度、室內(nèi)濕度、防電磁干擾、防靜電等環(huán)境的建設,為網(wǎng)絡設備的正常工作提供良好的環(huán)境。
二、交換機的軟件故障:
交換機的軟件故障是指系統(tǒng)及其配置上的故障,它可以分為以下幾類。
(1)系統(tǒng)錯誤:
交換機系統(tǒng)是硬件和軟件的結合體。在交換機內(nèi)部有一個可刷新的只讀存儲器,它保存的是這臺交換機所必需的軟件系統(tǒng)。這類錯誤也和我們常見的 Windows、Linux一樣,由于當時設計的原因,存在一些漏洞,在條件合適時,會導致交換機滿載、丟包、錯包等情況的發(fā)生。所以交換機系統(tǒng)提供了諸 如Web、TFTP等方式來下載并更新系統(tǒng)。當然在升級系統(tǒng)時,也有可能發(fā)生錯誤。
對于此類問題,我們需要養(yǎng)成經(jīng)常瀏覽設備廠商網(wǎng)站的習慣,如果有新的系統(tǒng)推出或者新的補丁,請及時更新。
(2)配置不當:
初學者對交換機不熟悉,或者由于各種交換機配置不一樣,管理員往往在配置交換機時會出現(xiàn)配置錯誤。比如VLAN 劃分不正確導致網(wǎng)絡不通,端口被錯誤地關閉,交換機和網(wǎng)卡的模式配置不匹配等原因。這類故障有時很難發(fā)現(xiàn),需要一定的經(jīng)驗積累。如果不能確保用戶的配置有 問題,請先恢復出廠默認配置,然后再一步一步地配置。最好在配置之前,先閱讀說明書,這也是網(wǎng)管所要養(yǎng)成的習慣之一。每臺交換機都有詳細的安裝手冊、用戶 手冊,深入到每類模塊都有詳細的講解。由于很多交換機的手冊是用英文編寫的,所以英文不好的用戶可以向供應商的工程師咨詢后再做具體配置。
(3)密碼丟失:
這可能是每個管理員都曾經(jīng)經(jīng)歷過的。一旦忘記密碼,都可以通過一定的操作步驟來恢復或者重置系統(tǒng)密碼。有的則比較簡單,在交換機上按下一個按鈕就可以了。而有的則需要通過一定的操作步驟才能解決。
此類情況一般在人為遺忘或者交換機發(fā)生故障后導致數(shù)據(jù)丟失,才會發(fā)生。
(4)外部因素:
由于病毒或者黑客攻擊等情況的存在,有可能某臺主機向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成交換機處理器過分繁忙,致使數(shù)據(jù)包來不及轉(zhuǎn)發(fā), 進而導致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風暴,它不僅會占用大量的網(wǎng)絡帶寬,而且還將占用大量的CPU處理時間。網(wǎng)絡如果長時間被大量廣播 數(shù)據(jù)包所占用,正常的點對通信就無法正常進行,網(wǎng)絡速度就會變慢或者癱瘓。
一塊網(wǎng)卡或者一個端口發(fā)生故障,都有可能引發(fā)廣播風暴。由于交換機只能分割沖突域,而不能分割廣播域(在沒有劃分VLAN 的情況下),所以當廣播包的數(shù)量占到通信總量的30%時,網(wǎng)絡的傳輸效率就會明顯下降。
總的來說軟件故障應該比硬件故障較難查找,解決 問題時,可能不需要花費過多的金錢,而需要較多的時間。最好在平時的工作中養(yǎng)成記錄日志的習慣。每當發(fā)生故障時,及時做好故障現(xiàn)象記錄、故障分析過程、故 障解決方案、故障歸類總結等工作,以積累自己的經(jīng)驗。比如有時在進行配置時,由于種種原因,當時沒有對網(wǎng)絡產(chǎn)生影響或者沒有發(fā)現(xiàn)問題,但也許幾天以后問題 就會逐漸顯現(xiàn)出來。如果有日志記錄,就可以聯(lián)想到是否前幾天的配置有錯誤。由于很多時候都會忽略這一點,以為是在其他方面出現(xiàn)問題,當走了許多彎路之后, 才找到問題所在。所以說記錄日志及維護信息是非常必要的。
三、交換機故障的一般排障步驟:
交換機的故障多種多樣,不同的故障有不同的表現(xiàn)形式。故障分析時要通過各種現(xiàn)象靈活運用排除方法(如排除發(fā)、對比法、替換法),找出故障所在,并及時排除。
(1)排除法:
當我們面對故障現(xiàn)象并分析問題時,無意中就已經(jīng)學會使用排除法來確定發(fā)生故障的方向了。這種方法是指依據(jù)所觀察到的故障現(xiàn)象,盡可能全面地列舉出所有可 能發(fā)生的故障,然后逐個分析、排除。在排除時要遵循有簡到繁的原則,提高效率。使用這種方法可以應付各種各樣的故障,但維護人員需要有較強的邏輯思維,對 交換機知識有全面深入的了解。
(2)對比法:
所謂對比法,就是利用現(xiàn)有的、相同型號的且能夠正常運行的交換機作為參 考對象,和故障交換機之間進行對比,從而找出故障點。這種方法簡單有效,尤其是系統(tǒng)配置上的故障,只要簡單地對比一下就能找出配置的不同點,但是有時要找 一臺型號相同、配置相同的交換機也不是一件容易的事。
(3)替換法:
這是我們最常用的方法,也是在維修電腦中使用頻率較高的方法。替換法是指使用正常的交換機部件來替換可能有故障的部件,從而找出故障點的方法。它主要用于硬件故障的診斷,但需要注意的是,替換的部件必須是相同品牌、相同型號的同類交換機才行。
四、分析交換機故障的原則
當然為了使排障工作有章可循,我們可以在故障分析時,按照以下的原則來分析。
1.由遠到近
端口模塊—>水平線纜—>跳線—>交換機這樣一條路線,逐個檢查,先排除遠端故障的可能。
2.由外而內(nèi)
如果交換機存在故障,我們可以先從外部的各種指示燈上辨別,然后根據(jù)故障指示,再來檢查內(nèi)部的相應部件是否存在問題。比如POWER LED為綠燈表示電源供應正常,熄滅表示沒有電源供應;LINK LEDs為黃色表示現(xiàn)在該連接工作在10Mb/s,綠色表示為100 Mb/s,熄滅表示沒有連接,閃爍表示端口被管理員手動關閉;RDP LED表示冗余電源;MGMT LED表示管理員模塊。無論能否從外面的出故障所在,都必須登錄交換機以確定具體的故障所在,并進行相應的排障措施。
3.由軟到硬
發(fā)生故障,誰都不想動不動就那螺絲刀去先拆了交換機再說,所以在檢查時,總是先從系統(tǒng)配置或系統(tǒng)軟件上著手進行排查。如果軟件上不能解決問題,那就是硬 件有問題了。比如某端口不好用,那我們可以先檢查用戶所連接的端口是否不在相應的VLAN中,或者該端口是否被其他的管理員關閉,或者配置上的其他原因。 如果排除了系統(tǒng)和配置上的各種可能,那就可以懷疑到真正的問題所在——硬件故障上。
4.先易后難
在遇到故障分析較復雜時,必須先從簡單操作或配置來著手排除。這樣可以加快故障排除的速度,提高效率。
責任編輯:售電衡衡
-
權威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產(chǎn)業(yè),設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務,新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設典型實踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進這個行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎設施,電力新基建 -
燃料電池汽車駛入尋常百姓家還要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產(chǎn)業(yè),設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務,新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市