根據(jù)經(jīng)驗(yàn)發(fā)現(xiàn)大多數(shù)網(wǎng)絡(luò)故障是與硬件有關(guān)的:比如電纜、中繼器、Hub、Switch和網(wǎng)卡等。本文描述了以太網(wǎng)典型故障的查找過(guò)程。
一、故障查找的一般規(guī)則
以太網(wǎng)的故障查找可分為5個(gè)步驟:
1.收集所有可以收集到的有價(jià)值的信息,分析故障的現(xiàn)象。 2.將故障定位到某一特定的網(wǎng)段,或者是單一獨(dú)立功能組(模塊),也可以是某一用戶。 3.確認(rèn)是特定的硬件故障還是軟件故障。 4.定位與修復(fù)故障。 5.驗(yàn)證故障的排除。
一般來(lái)說(shuō),最好的辦法是先把故障細(xì)分或隔離在一個(gè)小的功能段上,即首先排除最大的簡(jiǎn)單段,從任何一個(gè)方便的、靠近問(wèn)題的站點(diǎn)入手,利用二分法隔離故障,再繼續(xù)使用二分法直至把故障劃分到最小的單位。網(wǎng)管人員不要過(guò)多指望用戶會(huì)給出完整準(zhǔn)確的情況描述,最好由自己來(lái)確認(rèn)一下。當(dāng)然也可以讓用戶演示所發(fā)現(xiàn)的問(wèn)題。由于網(wǎng)絡(luò)故障帶來(lái)的壓力和混亂,人們經(jīng)常忽略一些細(xì)節(jié)問(wèn)題。如果某個(gè)部件出了問(wèn)題,最好不要立即去替換它,除非能肯定故障的來(lái)源。
二、故障查找應(yīng)注意的事項(xiàng)
由于以太網(wǎng)采用通用總線拓?fù)浣Y(jié)構(gòu)以及物理層可擴(kuò)展的潛在問(wèn)題,所以某個(gè)特定物理層的問(wèn)題會(huì)以不同的方式顯示出來(lái),而且由于采用的測(cè)試手段、位置和環(huán)境不同,顯示出的現(xiàn)象還常常有矛盾。
為了避免被假象誤導(dǎo),推薦兩個(gè)故障查找的步驟:
1.沿網(wǎng)段多做幾次測(cè)試
如果故障現(xiàn)象隨測(cè)試點(diǎn)的不同還保持一樣的話,就可以依照所測(cè)試出的故障現(xiàn)象去排除。如果故障現(xiàn)象在一些或所有的測(cè)試點(diǎn)都不相同的話,就要把查找故障的方向定在物理層(除非有特別提示),例如去查找壞的電纜、噪聲環(huán)境、接地循環(huán)等故障。
2.要提高測(cè)試質(zhì)量,在測(cè)試的同時(shí)要把測(cè)試儀器設(shè)置成至少可同時(shí)發(fā)送較低的流量。由于增加了網(wǎng)絡(luò)流量,微小的和間歇性的物理層問(wèn)題會(huì)被暴露出來(lái)。
三、典型的網(wǎng)絡(luò)故障
故障1、不能訪問(wèn)服務(wù)器或某項(xiàng)服務(wù)
在這里設(shè)定服務(wù)器或某項(xiàng)服務(wù)以前是正常的,并且已經(jīng)做過(guò)如下的工作:
重新冷啟動(dòng)PC機(jī)(熱啟動(dòng)不能復(fù)位全部的適配卡)。
確認(rèn)PC機(jī)沒(méi)有本身的硬件故障。
確認(rèn)所有的網(wǎng)絡(luò)電纜都連接正確。
確認(rèn)所有的網(wǎng)卡驅(qū)動(dòng)軟件都正常地裝入,沒(méi)有報(bào)告錯(cuò)誤。
確認(rèn)服務(wù)器或服務(wù)沒(méi)有改變,比如重新配置增加硬? 軟件。
要測(cè)試一下這一故障是否只影響該工作站(本地故障)還是會(huì)影響其它站點(diǎn)(大范圍故障),可以通過(guò)其它工作站裝入服務(wù)器或服務(wù)來(lái)證明這一點(diǎn)。這些工作站要在同一網(wǎng)段或Hub上。如果故障在同一網(wǎng)段或Hub上的其它的站點(diǎn)也存在,就試著從其它的Hub或網(wǎng)段上的站點(diǎn)進(jìn)行測(cè)試。
(一)本地故障
在進(jìn)行硬件故障查找以前,要確認(rèn)其它用戶也不能登錄從這臺(tái)機(jī)器上,這就排除了用戶帳號(hào)的錯(cuò)誤。對(duì)一個(gè)單一的站點(diǎn)來(lái)說(shuō),典型的故障多發(fā)生在壞的電纜、壞的網(wǎng)卡、驅(qū)動(dòng)軟件或是工作站設(shè)置的不正確等問(wèn)題上。
(二)全局問(wèn)題
通常來(lái)說(shuō),在同軸網(wǎng)中的物理層故障會(huì)導(dǎo)致災(zāi)難性的網(wǎng)絡(luò)故障。使用“二分法”來(lái)查找這類(lèi)故障是可以很快定位解決的。間歇性的故障是比較難以隔離的。
|