每天資訊交換機常見故障分析與排除方法

菜單

交換機常見故障分析與排除方法

隨著網際網路科技的發展,各種各樣的網路裝置出現在人們的視野當中。交換機是一種很常見的網際網路裝置,它能夠讓使用者獨享頻寬。與此同時在日常工作中,交換機故障的現象是多樣的,故障的原因也是多樣的,本文將交換機分為硬體和軟體故障,並針對性地進行分析,逐類排除。

交換機常見故障分析與排除方法

一、交換機硬體故障:

交換機故障一般可以分為硬體故障和軟體故障兩大類。硬體故障主要指交換機電源、背板、模組、埠 等部件的故障,可以分為以下幾類。

(1)電源故障:

由於外部供電不穩定,或者電源線路老化、靜電、雷擊等原因導致電源損壞或者風扇停止,從而不能正常工作。由於電源緣故而導致機內其他部件損壞的事情也經常發生。

針對這類故障,首先應該做好外部電源的供應工作,透過引入獨立的電力線來提供獨立的電源,並新增穩壓器來避免瞬間高壓或低壓現象。一般來說,有兩路電供電,但由於各方面的原因,不可能為每臺交換機提供雙路供電,可以新增UPS(不間斷電源)來保證交換機的正常供電,最好使用提供穩壓功能的UPS。另外還要在機房內設定專業的避雷措施,來避免雷電對交換機的傷害。

(2)埠故障:

這是最常見的硬體故障,無論是光纖埠還是雙絞線的RJ-45埠,在插拔介面時一定要小心。如果不小心把光纖插頭弄髒,可能導致光纖埠汙染而不能正常通訊。我們經常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了埠的故障發生率。在搬運時不小心,也可能導致埠物理損壞。如果購買的水晶頭尺寸偏大,插入交換機時,也容易破壞埠。此外,如果接在埠上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會導致所連交換機埠被擊壞,或者造成更加不可預料的損傷。

一般情況下,埠故障是某一個或者幾個埠損壞。所以,在排除了埠所連計算機的故障後,可以透過更換所連埠,來判斷其是否損壞。遇到此類故障,可以在電源關閉後,用酒精棉球清洗埠。如果埠確實被損壞,那就只能更換埠了。

(3)模組故障:

交換機是由很多模組組成,比如:堆疊模組、管理模組(也叫控制模組)、擴充套件模組等。這些模組發生故障的機率很小,不過一旦出現問題,就會遭受巨大的經濟損失。如果插拔模組時不小心,或者搬運交換機時受到碰撞,或者電源不穩定等情況,都可能導致此類故障的發生。

當然上面提到的這3個模組都有外部介面,比較容易辨認,有的還可以透過模組上的指示燈來辨別故障。比如:堆疊模組上有一個扁平的梯形埠,或者有的交換機上是一個類似於USB的介面。管理模組上有一個CONSOLE口,用於和網管計算機建立連線,方便管理。如果擴充套件模組是光纖連線的話,會有一對光纖介面。

在排除此類故障時,首先確保交換機及模組的電源正常供應,然後檢查各個模組是否插在正確的位置上,最後檢查連線模組的線纜是否正常。在連線管理模組時,還要考慮它是否採用規定的連線速率,是否有奇偶校驗,是否有資料流控制等因素。連線擴充套件模組時,需要檢查是否匹配通訊模式,比如:使用全雙工模式還是半雙工模式。當然如果確認模組有故障,解決的方法只有一個,那就是應當立即聯絡供應商給以更換。

(4)背板故障:

交換機的各個模組都是接插在背板上的。如果環境潮溼,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱效能不好或環境溫度太高導致機內溫度升高,致使元器件燒壞。

在外部電源正常供電的情況下,如果交換機的各個內部模組都不能正常工作,那就可能是背板壞了,遇到這種情況唯一的辦法就是更換背板了。但硬體更新後,同一名稱的電路板塊可能有多種不同的型號。在一般情況下,新型號電路板的功能會相容舊型號電路板的功能。但舊型號的電路板的功能,就不一定能相容新型號電路板的功能了。

(5)線纜故障:

連線電纜和配線架的跳線是用來連線模組、機架和裝置用的。如果這些連線電纜內的纜芯或跳線發生了短路、斷路或虛接,就會形成通訊系統的故障。

從上面的幾種硬體故障來看,機房環境不佳極易導致各種硬體故障,所以在建設機房時,必須先做好防雷接地及供電電源、室內溫度、室內溼度、防電磁干擾、防靜電等環境的建設,為網路裝置的正常工作提供良好的環境。

交換機常見故障分析與排除方法

二、交換機的軟體故障:

交換機的軟體故障是指系統及其配置上的故障,它可以分為以下幾類。

(1)系統錯誤:

程式BUG:軟體程式設計存在著缺陷。交換機系統是硬體和軟體的結合體。在交換機內部有一個可重新整理的只讀儲存器,它儲存的是這臺交換機所必需的軟體系統。由於當時設計的原因,存在一些漏洞,在條件合適時,會導致交換機滿載、丟包、錯包等情況的發生。

對於此類問題,我們需要養成經常瀏覽裝置廠商網站的習慣,如果有新的系統推出或者新的補丁,請及時更新。

(2)配置不當:

由於各種交換機配置不一樣,網路管理員往往在配置交換機時會出現配置錯誤。主要錯誤有:

1、系統資料錯誤:

系統資料,包括軟體設定,用於對整個系統進行定義。如系統資料出現錯誤,也會造成系統全方位的故障,對整個交換局產生影響。

2、局資料錯誤:

局資料是根據交換局的具體情況而定義的。當局資料出現錯誤時,也會對整個交換局產生影響。

3、使用者資料錯誤:

使用者資料對每一個使用者的情況進行定義,如果使用者資料被錯誤設定,會對某個使用者產生影響。

4、硬體設定不合適:

硬體設定是為減少電路板的種類,而在電路板上設定的一組或幾組開關,用以定義該電路板的工作狀態或在系統中所處位置,如硬體設定得不正確,必會導致該電路板工作不正常。

這類故障有時很難發現,需要一定的經驗積累。如果不能確定配置是否有問題,請先恢復出廠預設配置,然後再一步一步地配置。最好在配置之前,先閱讀說明書。

(3)外部因素:

由於病毒或者駭客攻擊等情況的存在,有可能某臺主機向所連線的埠傳送大量不符合封裝規則的資料包,造成交換機處理器過分繁忙,致使資料包來不及轉發,進而導致緩衝區溢位產生丟包現象。還有一種情況就是廣播風暴,它不僅會佔用大量的網路頻寬,而且還將佔用大量的CPU處理時間。網路如果長時間被大量廣播資料包所佔用,正常的點對通訊就無法正常進行,網路速度就會變慢或者癱瘓。

總之,軟體故障應該比硬體故障較難查詢,解決問題時,可能不需要花費過多的金錢,而需要較多的時間。要網路管理員在平時的工作中養成記錄日誌的習慣。每當發生故障時,及時做好故障現象記錄、故障分析過程、故障解決方案、故障歸類總結等工作,以積累自己的經驗。每解決一個問題後都用心的去回顧問題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網路管理的重任。