IT貓撲網(wǎng):您身邊最放心的安全下載站! 最新更新|軟件分類(lèi)|軟件專(zhuān)題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置: 首頁(yè)系統(tǒng)集成網(wǎng)絡(luò)管理 → 老舊服務(wù)器硬件故障處理幾例

老舊服務(wù)器硬件故障處理幾例

時(shí)間:2015-06-28 00:00:00 來(lái)源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評(píng)論(1)

硬件故障是指服務(wù)器硬件出現(xiàn)異常而導(dǎo)致的各類(lèi)錯(cuò)誤。由于服務(wù)器構(gòu)成比較復(fù)雜,因此在檢查的時(shí)候必須認(rèn)真、仔細(xì)。下面以一臺(tái)惠普LH6000為例說(shuō)明。

有一臺(tái)惠普LH6000,配有256M內(nèi)存,使用一個(gè)PIIIXEON700帶2M高速緩存的處理器。開(kāi)機(jī)后沒(méi)有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務(wù)器的另一種報(bào)警方式,我會(huì)在文后說(shuō)明)。這種錯(cuò)誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯(cuò)或CPU出錯(cuò)或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯(cuò),這時(shí)情況就比較復(fù)雜了,必須經(jīng)過(guò)認(rèn)真慎重的思考。因?yàn)镃PU板塊在整個(gè)服務(wù)器中,占有舉足輕重的地位,如果它出錯(cuò)服務(wù)器是會(huì)報(bào)致命錯(cuò)誤的,并且在系統(tǒng)日志中會(huì)提示致命錯(cuò)誤,但報(bào)CPU電壓錯(cuò)的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開(kāi)機(jī)后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。

這時(shí),取出CPU仔細(xì)擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開(kāi)機(jī)依然無(wú)顯示。

相對(duì)處理器壞的情況來(lái)說(shuō)處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺(tái)LH6000中取下一個(gè)處理器電壓模塊,安裝在此服務(wù)器中。開(kāi)機(jī)后,服務(wù)器依然沒(méi)有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時(shí)的情況就比較明顯了。于是立即從另一臺(tái)LH6000中取下一個(gè)CPU安裝后,開(kāi)機(jī)正常。

在服務(wù)器的維修中,線索都會(huì)顯得撲朔迷離,一般來(lái)說(shuō)不可能一次就可以準(zhǔn)確地判斷出問(wèn)題的所在。這樣就要求相關(guān)人員要有信心及耐心。出現(xiàn)錯(cuò)誤一般的流程是通過(guò)系統(tǒng)日志上的信息來(lái)解決,如果沒(méi)有解決問(wèn)題再找出其它因素,然后再看日志信息??傊?wù)器出錯(cuò)后,必須一步一步解決,沒(méi)有捷徑可言。

又如:

有一臺(tái)HPLH4開(kāi)機(jī)不顯示,發(fā)現(xiàn)開(kāi)機(jī)時(shí)系統(tǒng)日志沒(méi)有任何信息,且系統(tǒng)指示燈不亮。初步判斷是電源方面出現(xiàn)了錯(cuò)誤。經(jīng)過(guò)仔細(xì)檢查,發(fā)現(xiàn)服務(wù)器的電源是正常的,因此最大的可能就是服務(wù)器的電源管理板出現(xiàn)故障。更換電源管理板后,開(kāi)機(jī)顯示正常。但這時(shí),新的問(wèn)題來(lái)了:自檢時(shí),用CTRL+M不能檢測(cè)到硬盤(pán)。

硬盤(pán)在別的服務(wù)器上是正常的,因此立即清除此服務(wù)器的CMOS,但依然不正常。我立刻上網(wǎng)找到此服務(wù)器的最新BIOS,升級(jí)BIOS后也不能解決問(wèn)題。又檢查硬盤(pán)籠子和服務(wù)器里的數(shù)據(jù)線及電源線后依然出錯(cuò)。這時(shí),一般情況會(huì)懷疑是服務(wù)器的I/O板(輸入輸出板塊)有問(wèn)題。但就在這個(gè)時(shí)候,我發(fā)現(xiàn)在I/O板上有一個(gè)非HP的舊式網(wǎng)卡,立即去除此網(wǎng)卡后服務(wù)器就一切正常。

硬件故障并不單單指硬件有問(wèn)題,它也指硬件之間不兼容。因?yàn)榉?wù)器的正常運(yùn)作需要各部件之間的大力協(xié)調(diào)。建議大家在采購(gòu)各元件時(shí),都采用同一品牌原裝的,并且要采用能發(fā)揮服務(wù)器性能的元件(上例中的舊式網(wǎng)卡即使正常也會(huì)嚴(yán)重影響服務(wù)器性能),這樣才不會(huì)發(fā)生莫明其妙的故障。

我曾遇到過(guò)一種情況:用戶需要把他的HPLH6000升級(jí)到雙網(wǎng)卡,我建議他購(gòu)買(mǎi)原裝網(wǎng)卡,但當(dāng)他看到HPLH6000的網(wǎng)卡是采用的INTEL82559芯片后,斷然決定不使用原裝網(wǎng)卡而采用另一品牌也采用INTEL82559的網(wǎng)卡。過(guò)了幾天,他打電話給我說(shuō),他的新網(wǎng)卡不能使用網(wǎng)絡(luò)冗余及數(shù)據(jù)校驗(yàn),并懷疑服務(wù)器有問(wèn)題。我?guī)Я艘粋€(gè)HP網(wǎng)卡到用戶那里,仔細(xì)檢查了服務(wù)器的環(huán)境完全正常后,把HP網(wǎng)卡安裝到機(jī)器上后一切正常。這個(gè)例子更加說(shuō)明了,要發(fā)揮服務(wù)器的最大性能及功能,必須使用原品牌原裝的配件。非原品牌非原裝的配件,不能支持服務(wù)器的某些功能,嚴(yán)重的會(huì)影響到服務(wù)器的正常使用。

一般來(lái)說(shuō)中、高端的服務(wù)器報(bào)警系統(tǒng)都比較完善,除了系統(tǒng)日志外,還有指示燈。以HPLH6000來(lái)說(shuō),指示燈的綠色燈常亮表示服務(wù)器正常;綠燈亮而黃色閃爍表示服務(wù)器有故障,但不是致命的;如果三燈閃爍(綠、黃、紅三燈)就表示服務(wù)器有致命故障,服務(wù)器停止運(yùn)行。相比較而言,指示燈只能提示比較籠統(tǒng)的故障,而系統(tǒng)日志就比較完全。在維修中,必須仔細(xì)察看這兩種報(bào)警系統(tǒng)的信息。有一點(diǎn)必須注意的是系統(tǒng)日志是一個(gè)存儲(chǔ)器,容量有限(LH6000能存200條信息)。當(dāng)容量不夠時(shí)必須清空,否則服務(wù)器將報(bào)警,一般是服務(wù)器指示燈報(bào)非致命錯(cuò)誤,但卻不能再存任何信息。

要避免硬件故障發(fā)生頻率,服務(wù)器管理人員必須注意服務(wù)器的使用環(huán)境完全正常。比較重要的服務(wù)器必須在恒溫、恒濕的環(huán)境;電壓也要符合,不僅要采用UPS,還必須接地線,必須是左零線、右火線,零地電壓在1~3伏。在開(kāi)、關(guān)服務(wù)器上必須符合正常的流程。工作人員必須嚴(yán)格執(zhí)行操作流程。

一般情況來(lái)說(shuō),服務(wù)器管理人員對(duì)于硬件故障只要有豐富的經(jīng)驗(yàn)都能很快找出故障所在,如果不能解決就必須迅速與服務(wù)器的售后服務(wù)中心聯(lián)系。

關(guān)鍵詞標(biāo)簽:服務(wù)器,硬件故障

相關(guān)閱讀

文章評(píng)論
發(fā)表評(píng)論

熱門(mén)文章 路由器地址大全-各品牌路由設(shè)置地址 路由器地址大全-各品牌路由設(shè)置地址 各品牌的ADSL與路由器出廠默認(rèn)IP、帳號(hào)、密碼 各品牌的ADSL與路由器出廠默認(rèn)IP、帳號(hào)、密碼 Nslookup命令詳解-域名DNS診斷 Nslookup命令詳解-域名DNS診斷 站長(zhǎng)裝備:十大網(wǎng)站管理員服務(wù)器工具軟件 站長(zhǎng)裝備:十大網(wǎng)站管理員服務(wù)器工具軟件

相關(guān)下載

    人氣排行 各品牌的ADSL與路由器出廠默認(rèn)IP、帳號(hào)、密碼 路由器地址大全-各品牌路由設(shè)置地址 騰達(dá)路由器怎么設(shè)置?騰達(dá)路由器設(shè)置教程 ADSL雙線負(fù)載均衡設(shè)置詳細(xì)圖文教程 路由表說(shuō)明(詳解route print) Nslookup命令詳解-域名DNS診斷 網(wǎng)管員實(shí)際工作的一天 網(wǎng)管必會(huì)!了解交換機(jī)控制端口流量