![]() |
學校地址:湖南省 長沙市 雨花區 車站南路紅花坡路口 |
![]() |
學校地址:湖南省 長沙市 雨花區 車站南路紅花坡路口 |
我的辦公局域網內,有兩臺關鍵的服務器,一個是主服務器、一個是備份服務器,中間通過心跳線連接。近日在某臺主機改動配置文件后的一次重啟后,網絡設置沒做任何改動,而心跳功能卻不能實現了,兩臺機器不能通過心跳線互相連通。
什么是心跳線
心跳線是用于連接A、B兩臺服務器間的網線。在這兩臺服務器A、B中,A為工作機,B為備份機,它們之間通過一根心跳線來連接。一般在服務器上都配有兩塊網卡,其中一塊專門用于兩臺服務器(節點)間的通訊。安裝在服務器上的軟件通過心跳線來實時監測對方的運行狀態。一旦正在工作的主機A因為各種硬件故障,如電源失效、主要部件失效或者啟動盤失效等導致系統發生故障,心跳線會反映給互為備份的另外一臺主機,主機B可以立即投入工作。這樣可以在 大限度上保證網絡的正常運行。這也稱為心跳檢測。心跳線主要利用一條RS-233檢測鏈路來完成,采用Ping方式檢測驗證系統Down機檢測的準確性。
故障排除
首先恢復配置文件再重啟,故障依舊,兩臺機器都可正常運行,心跳線卻依然有問題。看來不是改動配置文件所引起的故障。
由于心跳線是通過網卡相連來檢測服務器狀態的,所以要重點查看每臺機器心跳線連接的網卡狀態及配置,可經檢查網卡狀態并沒有問題,網卡燈也是亮的。難道是網線沒插好或是有問題?重新用一根確認正常的網線替換下原網線,可是兩個服務器之間的心跳線還是不通,至此已基本排除了硬件方面的問題,估計還是網卡的設置有問題。
進入兩臺機器的網卡狀態選項,將兩臺機器的網卡狀態一項一項地進行比較。突然我發現兩個網卡的速率及狀態不一樣,一個是100Mbit/s全雙工,而另一個則是10Mbit/s半雙工,而其他選項全部相同。難道是這個原因?把兩臺機器的網卡狀態統一設置為100Mbit/s全雙工,再用Ping命令檢測連接狀態,結果顯示連接正常,問題竟然解決了。再重新設置配置文件,這次強制網卡狀態為100Mbit/s全雙工,重新啟動機器,服務器工作一切正常。
總結
本次故障的原因其實比較簡單,只是表現出來的現象稍微復雜一些。該服務器使用的是一個10/100Mbit/s自適應以太網卡,設計速度為100Mbit/s。機器重啟后,網卡自動選擇狀態。由于兩邊網卡所選擇的工作狀態不一致,導致網絡不通。
現在常見的網卡有10Mbit/s、100Mbit/s和10/100Mbit/s自適應網卡。當使用10Mbit/s或100Mbit/s這兩種兩個相同固定速率的網卡連接時,一般不會產生什么大問題,可當使用10/100Mbit/s自適應以太網卡時,有時會產生一些莫名其妙的問題。建議大家在使用這類網卡時 好設置一個初始的速率,且 好兩邊速率相同,而不要使用自適應。速率設置的問題常常會導致網絡時通時不通。
使用自適應以太網卡時,有時會產生一些莫名其妙的問題。建議大家在使用這類網卡時 好設置一個初始的速率,且 好兩邊速率相同,而不要使用自適應。速率設置的問題常常會導致網絡時通時斷。
|