Problém se SMR disky Seagate Archive 8TB

Pavel Machek pavel na ucw.cz
Úterý Duben 3 18:05:26 CEST 2018


> 	Dobrý den,
> 
> mám následující problém s disky Seagate Archive 8TB, ST8000AS0002
> (4 KB sektory, SMR zápis, podle nějakých recenzí na webu mají cca 20 GB
> prostoru pro cache náhodných zápisů):
> 
> 	Při zálohování na tyto disky se čas od času stane, že se některý
> z disků náhodně odpojí. Když se to stane, jádro vypíše do logu chyby SCSI
> vrstvy (přikládám níže) a disk přestane být v systému vidět (udev smaže
> i jeho uzly v /dev). Následně si pochopitelně začne stěžovat filesystém
> (ext4), že mu zmizel disk, a že aborting journal, atd.
> 
> 	Máme dva různé zálohovací stroje, každém je typicky 6 takovýchto
> disků, průměrně pozorujeme dvě takováto odpojení za týden (čili u jednoho
> disku to vychází na střední dobu 3 týdny mezi závadami). Disků máme tak
> cca 15, dělají to nejspíš všechny. Na jednom serveru jsou disky na SAS
> backplane s řadičem LSI SAS2308 (driver mpt_sas), na druhém serveru jsou
> tytéž disky na lokálním AHCI. Čili řadič a jeho driver bych snad vyloučil.
> 
> 	Některé disky toto dělají častěji než jiné, ale to přikládám
> různému charakteru dat, která se na ty jednotlivé disky zálohují.
> 
> 	Největší podivnost na tom je, že když toto nastane, tak ten slot
> pro disk přestane být použitelný - nepomůže disk vytáhnout a zpět zasunout,
> nepomůže vložit jiný disk, nepomůže "echo 0 0 0 > scan" v příslušném
> adresáři sysfs. Dokonce nepomůže ani reboot přes kexec, ani reboot přes
> BIOS. Je potřeba ten počítač vypnout (shutdown -h nebo tlačítkem) a pak
> teprve zapnout. Což zase směřuje k řadiči, ale že by se takto choval
> LSI SAS i AHCI, to se mi nezdá.

No, zrejme mate 3 problemy, a dva z nich jsou s radici...

Zkusil bych nejnovejsi jadro, a kdyz to nepomuze, tak kontaktovat
autory ovladacu...
> 

-- 
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html


Další informace o konferenci Linux