Re: disk na odchodu?

jaroslav noví oldcpu na centrum.cz
Neděle Duben 15 08:14:38 CEST 2018


 
______________________________________________________________
> Od: jaroslav noví <oldcpu na centrum.cz>
> Komu: Diskuse o Linuxu v cestine <linux na linux.cz>
> Datum: 15.04.2018 07:57
> Předmět: Re: disk na odchodu?
>
>
 >
 Dobrý den,
 
 ta vaše řádka ještě nemusí nic znamenat, důležitější je:
 197 Current_Pending_Sector  0x0032   100   001   000    Old_age 
 Always       -       216
 a pak také FAILING_NOW, asi už nemá kam dál realokovat?
   
 spusťte:
 badblocks -svw /dev/sdf třeba 3x za sebou a pak pokus opakujte a začněte 
 s smartmontools, pokud bude 197 nulové, pak to zkuste i s těmi soubory.
 ----------------------------
 už mi více než 5 hodin běží fsck. Povedlo se mi totiž naformátovat disk na ext4.
 Hned na nulté stopě ohlásil chyby, což samo o sobě stačí k vyhození.
 Po cca 0,01% činnosti našel asi 200 vadných sektorů. Teď je zhruba na 44% a vadných sektorů je 223.
  
 Použití badblocks plánuji v dalších krocích.
 ===============
  
 Tak to nakonec dopadlo.
 Po zhruba 70 hodinách to disk přestalo bavit. Zřejmě došel k závěru, že dosť bolo vlády badblocks.
 Měl jsem celkem kliku, že těsně před tím, než disk odpochodoval jsem si odečetl hlášení badbloks.
 Chyb bylo nalezeno cca 446. Umřelo to na necelých 99% testované kapacity.
 Ještě jsem pomocí smartcrl -a /dev/sdf zjistil, že položka 197 se změnila z 216 na 8, vypadalo to nadějně.
  
 Pak disk umřel.
  
 Ani po několika restartech se disk nedal přesvědčit, aby naběhl. v /var/log/dmesg jsem postupně našel:
  
 [    0.252823] ata6: SATA max UDMA/133 abar m512 na 0xf7c10000 port 0xf7c10180 irq 26
 .........
 [   11.183965] ata6: softreset failed (device not ready)
 [   21.199965] ata6: softreset failed (device not ready)
 [   31.755966] ata6: link is slow to respond, please be patient (ready=0)
 [   56.235969] ata6: softreset failed (device not ready)
 [   56.239524] ata6: limiting SATA link speed to 3.0 Gbps
 [   61.455963] ata6: softreset failed (device not ready)
 [   61.459494] ata6: reset failed, giving up
  
 ve výstupu příkazu fdisk -l již není,
 z čehož usuzuji že disk je v křemíkovém nebi. Budiž mu hlavičky lehké.
  
--------------------------------

Jen ješte malé doplnění.
Po vypnutí počítače, fyzickém odpojní disku od kabelů, mírném ochlazení, měl na omak cca 38-40 stupňů celsiových, znovu po připojení na kabely a zapnutí se v /var/log/dmesg objevilo:
 
[    0.252834] ata6: SATA max UDMA/133 abar m512 na 0xf7c10000 port 0xf7c10180 irq 26
........
[    1.588039] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[    1.594075] ata6.00: ATA-9: HGST HTS541010A7E630, SE0OA4A0, max UDMA/133
[    1.596533] ata6.00: 1953525168 sectors, multi 16: LBA48 NCQ (depth 31/32), AA
[    1.602957] ata6.00: configured for UDMA/133
[    1.605708] scsi 5:0:0:0: Direct-Access     ATA      HGST HTS541010A7 A4A0 PQ: 0 ANSI: 5
[    1.606948] sd 5:0:0:0: Attached scsi generic sg5 type 0
[    1.606959] sd 5:0:0:0: [sdf] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
[    1.606960] sd 5:0:0:0: [sdf] 4096-byte physical blocks
[    1.606965] sd 5:0:0:0: [sdf] Write Protect is off
[    1.606965] sd 5:0:0:0: [sdf] Mode Sense: 00 3a 00 00
[    1.606994] sd 5:0:0:0: [sdf] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
[    1.616288] ata6: log page 10h reported inactive tag 0
[    1.617259] ata6.00: exception Emask 0x1 SAct 0x20000000 SErr 0x0 action 0x0
[    1.618189] ata6.00: irq_stat 0x40000001
[    1.619103] ata6.00: failed command: READ FPDMA QUEUED
[    1.620040] ata6.00: cmd 60/08:e8:00:00:00/00:00:00:00:00/40 tag 29 ncq dma 4096 in
                        res 41/04:08:00:00:00/00:00:00:00:00/00 Emask 0x1 (device error)
[    1.622770] ata6.00: status: { DRDY ERR }
[    1.624125] ata6.00: error: { ABRT }
[    1.632695] ata6.00: configured for UDMA/133
[    1.634166] ata6: EH complete
[    1.636025] ata6.00: NCQ disabled due to excessive errors
[    1.636962] ata6.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x6
[    1.637894] ata6.00: irq_stat 0x40000001
[    1.638771] ata6.00: failed command: READ FPDMA QUEUED
[    1.639646] ata6.00: cmd 60/08:00:00:00:00/00:00:00:00:00/40 tag 0 ncq dma 4096 in
                        res ff/3f:3f:37:c8:10/00:00:00:00:00/00 Emask 0x402 (HSM violation) <F>
[    1.641402] ata6.00: status: { Busy }
[    1.642274] ata6.00: error: { AMNF IDNF ABRT }
[    1.643147] ata6: hard resetting link
[    2.120021] ata6: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[    2.128826] ata6.00: configured for UDMA/133
[    2.130309] ata6: EH complete
[    2.131919] ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[    2.133417] ata6.00: irq_stat 0x40000001
[    2.134901] ata6.00: failed command: READ DMA
[    2.136376] ata6.00: cmd c8/00:08:00:00:00/00:00:00:00:00/e0 tag 16 dma 4096 in
                        res 51/04:08:00:00:00/00:00:00:00:00/00 Emask 0x1 (device error)
[    2.139318] ata6.00: status: { DRDY ERR }
[    2.140795] ata6.00: error: { ABRT }
[    2.148940] ata6.00: configured for UDMA/133
[    2.149844] ata6: EH complete
[    2.150857] ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[    2.151728] ata6.00: irq_stat 0x40000001
[    2.152587] ata6.00: failed command: READ DMA
[    2.153759] ata6.00: cmd c8/00:08:00:00:00/00:00:00:00:00/e0 tag 17 dma 4096 in
                        res 51/04:08:00:00:00/00:00:00:00:00/00 Emask 0x1 (device error)
 
a tato sekvence se opakovala 11x.
 
fdisk opět nic.
 
>   
 > JN
 >  
 _______________________________________________
 Linux mailing list
 Linux na linux.cz
 http://www.linux.cz/mailman/listinfo/linux <http://www.linux.cz/mailman/listinfo/linux>



Další informace o konferenci Linux