根據(jù)經(jīng)驗(yàn)發(fā)現(xiàn)大多數(shù)網(wǎng)絡(luò)故障是與硬件有關(guān)的:比如電纜、中繼器、Hub、Switch和網(wǎng)卡等。本文描述了以太網(wǎng)典型故障的查找過程。
一、故障查找的一般規(guī)則
以太網(wǎng)的故障查找可分為5個步驟:
1.收集所有可以收集到的有價值的信息,分析故障的現(xiàn)象。 2.將故障定位到某一特定的網(wǎng)段,或者是單一獨(dú)立功能組(模塊),也可以是某一用戶。 3.確認(rèn)是特定的硬件故障還是軟件故障。 4.定位與修復(fù)故障。 5.驗(yàn)證故障的排除。
一般來說,最好的辦法是先把故障細(xì)分或隔離在一個小的功能段上,即首先排除最大的簡單段,從任何一個方便的、靠近問題的站點(diǎn)入手,利用二分法隔離故障,再繼續(xù)使用二分法直至把故障劃分到最小的單位。網(wǎng)管人員不要過多指望用戶會給出完整準(zhǔn)確的情況描述,最好由自己來確認(rèn)一下。當(dāng)然也可以讓用戶演示所發(fā)現(xiàn)的問題。由于網(wǎng)絡(luò)故障帶來的壓力和混亂,人們經(jīng)常忽略一些細(xì)節(jié)問題。如果某個部件出了問題,最好不要立即去替換它,除非能肯定故障的來源。
二、故障查找應(yīng)注意的事項(xiàng)
由于以太網(wǎng)采用通用總線拓?fù)浣Y(jié)構(gòu)以及物理層可擴(kuò)展的潛在問題,所以某個特定物理層的問題會以不同的方式顯示出來,而且由于采用的測試手段、位置和環(huán)境不同,顯示出的現(xiàn)象還常常有矛盾。
為了避免被假象誤導(dǎo),推薦兩個故障查找的步驟:
1.沿網(wǎng)段多做幾次測試
如果故障現(xiàn)象隨測試點(diǎn)的不同還保持一樣的話,就可以依照所測試出的故障現(xiàn)象去排除。如果故障現(xiàn)象在一些或所有的測試點(diǎn)都不相同的話,就要把查找故障的方向定在物理層(除非有特別提示),例如去查找壞的電纜、噪聲環(huán)境、接地循環(huán)等故障。
2.要提高測試質(zhì)量,在測試的同時要把測試儀器設(shè)置成至少可同時發(fā)送較低的流量。由于增加了網(wǎng)絡(luò)流量,微小的和間歇性的物理層問題會被暴露出來。
三、典型的網(wǎng)絡(luò)故障
故障1、不能訪問服務(wù)器或某項(xiàng)服務(wù)
在這里設(shè)定服務(wù)器或某項(xiàng)服務(wù)以前是正常的,并且已經(jīng)做過如下的工作:
重新冷啟動PC機(jī)(熱啟動不能復(fù)位全部的適配卡)。
確認(rèn)PC機(jī)沒有本身的硬件故障。
確認(rèn)所有的網(wǎng)絡(luò)電纜都連接正確。
確認(rèn)所有的網(wǎng)卡驅(qū)動軟件都正常地裝入,沒有報(bào)告錯誤。
確認(rèn)服務(wù)器或服務(wù)沒有改變,比如重新配置增加硬? 軟件。
要測試一下這一故障是否只影響該工作站(本地故障)還是會影響其它站點(diǎn)(大范圍故障),可以通過其它工作站裝入服務(wù)器或服務(wù)來證明這一點(diǎn)。這些工作站要在同一網(wǎng)段或Hub上。如果故障在同一網(wǎng)段或Hub上的其它的站點(diǎn)也存在,就試著從其它的Hub或網(wǎng)段上的站點(diǎn)進(jìn)行測試。
(一)本地故障
在進(jìn)行硬件故障查找以前,要確認(rèn)其它用戶也不能登錄從這臺機(jī)器上,這就排除了用戶帳號的錯誤。對一個單一的站點(diǎn)來說,典型的故障多發(fā)生在壞的電纜、壞的網(wǎng)卡、驅(qū)動軟件或是工作站設(shè)置的不正確等問題上。
(二)全局問題
通常來說,在同軸網(wǎng)中的物理層故障會導(dǎo)致災(zāi)難性的網(wǎng)絡(luò)故障。使用“二分法”來查找這類故障是可以很快定位解決的。間歇性的故障是比較難以隔離的。
|