Stopování HW chyb - chipset, harddisk

Jan Kasprzak kas na fi.muni.cz
Středa Leden 25 14:01:57 CET 2006


n_petr na seznam.cz wrote:
: S malinkou prodlevou zasílám výstup v příloze ze smartctl -a, smartctl 
: -t long. Jestli jsem výstup dobře pochopil, tak by měl být disk v 
: pořádku. Nebo které řádky konkrétně jsou nejdůležitější = na 
: kterých se píše, zda je disk OK?

	Ne, ten disk je zda se fyzicky problematicky (abych rovnou
nepsal vadny :-). Sice se zda ze dosud nerealokoval zadne sektory:

:   5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0

	A ze chyby vznikly pomerne davno (i kdyz SMART muze ukladat
jen nizsi bity casu vyskytu chyby):

:   9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       10872

	Ale nejake fyzicke chyby tam byly - na korektnim disku nemaji byt
zadne:

: ATA Error Count: 8 (device log contains only the most recent five errors)
[...] 
: Error 8 occurred at disk power-on lifetime: 3582 hours (149 days + 6 hours)
:   84 51 01 9e ae e2 f0  Error: ICRC, ABRT 1 sectors at LBA = 0x00e2ae9e = 14855838
: Error 7 occurred at disk power-on lifetime: 3582 hours (149 days + 6 hours)
:   84 51 01 9e ae e2 f0  Error: ICRC, ABRT 1 sectors at LBA = 0x00e2ae9e = 14855838
: Error 6 occurred at disk power-on lifetime: 3582 hours (149 days + 6 hours)
:   84 51 01 9e ae e2 f0  Error: ICRC, ABRT 1 sectors at LBA = 0x00e2ae9e = 14855838
: Error 5 occurred at disk power-on lifetime: 3582 hours (149 days + 6 hours)
:   84 51 01 9e ae e2 f0  Error: ICRC, ABRT 1 sectors at LBA = 0x00e2ae9e = 14855838
: Error 4 occurred at disk power-on lifetime: 2765 hours (115 days + 5 hours)
:   84 51 01 be 05 a4 f0  Error: ICRC, ABRT 1 sectors at LBA = 0x00a405be = 10749374
[...]
	Ctyri chyby ve stejnem sektoru, pata starsi v jinem sektoru.

	Self-test probehl dobre, takze mozna je disk OK. Zkusil bych disk
cely prepsat (treba pomoci badblocks -w), jestli opravdu do vsech sektoru
jde zapisovat. "long" self-test je definovan tak, ze ma zkontrolovat
"vyznamnou cast" sektoru disku, takze neco mu muze uniknout.

	Na druhou stranu pokud nelzou ty casove udaje, tak se ty chyby
objevily uz dost davno (10000 hodin lifetime oproti 3500h). Sam mam jeden
disk ktery ma ve SMART logu dve fyzicke chyby, ale mam pocit ze to byly
chyby v sektorech, do kterych bylo zapisovano v dobe kdy v serverovne
vypadla klimatizace. Po badblocks -w se disk tvari korektne (a taky
nerealokoval zadne sektory) a od te doby uz pres rok funguje (je to IBM).

	Vase vysvetleni o "nesnaseni se" disku mi neprijde pravdepodobne
- naposled jsem skutecne takove disky videl tak pred osmi lety. Navic disky
od stejneho vyrobce, to se mi nechce zdat.

-Y.

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
> Specs are a basis for _talking_about_ things. But they are _not_ a basis <
> for implementing software.                              --Linus Torvalds <


Další informace o konferenci Linux