váhavý, loudavý, usínající S.M.A.R.T. self test

Jan Kasprzak kas na fi.muni.cz
Čtvrtek Květen 14 17:43:43 CEST 2009


Petr Stehlik wrote:
: Pak jsem upgradoval kernel z 2.6.22 na 2.6.26 a dělal ještě pár změn a
: naráz jsem si všiml, že ty self testy neprobíhají - že prostě zůstávají
: trčet na třeba "90%" (či jiné hodnotě) celé týdny.

	Neporadim, ale pridam svuj problem se seagate a SMART testy,
treba nekdo ma neco podobneho.

	Mame asi cca 20 stejnych stroju a v nich po dvou discich tohoto typu

Model Family:     Seagate Barracuda 7200.11
Device Model:     ST31000340AS
Serial Number:    9QJ1D355
Firmware Version: SD1A
User Capacity:    1,000,204,886,016 bytes

Pred par mesici dodavatel napsal, ze je chyba ve firmwaru Seagate,
a ze mame upgradovat (asi jste o tom slyseli, diskutovalo se to
dokonce i na slashdotu :-). Tak jsem si naplanoval upgrade
(predchozi FW byl tysim SD15) a zaroven jsem upgradoval i jadro.

	Od te doby se sem tam stane (tak na 1-3 strojich za noc), ze se disk
odpoji od sbernice, SATA vrstva jadra nahlasi timeout, vyresetuje
disk, disk se najde a pokracuje se dal - stroj normalne funguje.
Disk ma po teto udalosti vypnuty SMART, musi se explicitne zapnout.
Ve SMART logu neni zadna chyba, ale vypadek nastava vzdy po
spusteni SMART self-testu (lhostejno jestli long nebo short, ale
jen u nekterych stroju z mnoha stejnych, navic pokazde u jinych).
Ve SMART logu je jenom ze prislusny test byl "Interrupted (host reset)"
coz je pochopitelne.

	Kdyz rucne zapnu SMART a pustim self-test, vetsinou dobehne
normalne. Jen parkrat se mi stalo, ze kdyz jsem se spustenim selftestu
vygeneroval vetsi zatez na tom disku, tak zase vytimeoutoval.

	Nemuze byt ze (nove?) jadro ma hlubsi NCQ frontu nebo neco? Nebo
ze ma kratsi timeout a disk si behem self-testu mozna dovoli
nereagovat o neco delsi dobu nez obvykle?

	Typicky se tato chyba vyskytuje na primarnim disku, kde je
vetsi zatez.

	Videli jste nekdo podobny problem?

-Yenya

-- 
| Jan "Yenya" Kasprzak  <kas at {fi.muni.cz - work | yenya.net - private}> |
| GPG: ID 1024/D3498839      Fingerprint 0D99A7FB206605D7 8B35FCDE05B18A5E |
| http://www.fi.muni.cz/~kas/    Journal: http://www.fi.muni.cz/~kas/blog/ |
>> If we wanted to trade simplicity and kewl design for usability I think <<
>> we all know the URL of the Apple Store.               --jmorris42 @LWN <<



Další informace o konferenci Linux