Linux tuhne co s tym?

Alexandr Malusek malusek na sysel.ujf.cas.cz
Pondělí Srpen 25 16:12:15 CEST 1997


vme na vladix.globtel.sk (Vladimir Meciar) writes:

> Za posledne dva dni mi Linux 3-krat vytuhol (zamrzol). Po surovom vypnuti
> a zapnuti v logoch dokopy nic nie je. 

Take nevim co s tim, ale popisi, jak se takoveto problemy resi na
Sunech - treba nekoho napadne, jak se to da udelat na PC.

Je potreba ziskat crash dump (obraz pameti) zatuhleho jadra a pak
pomoci adb udelat jeho analyzu. Nekdy se tim zjisti, ktery kernel
level thread zatuhnuti zpusobil - pak uz staci jen donutit jeho
vyvojare, aby prislusny SW opravili. Obvykle to ale neni tak snadne,
protoze jadro osetruje vselijaka HW preruseni, nekdy byva chyba HW,
...

Crash dump se obvykle da ziskat nasledujicim zpusobem: Pres Stop-A se
skoci do Open Boot PROMu (nefunguje-li Stop-A, pak obvykle zafunguje
odpojeni a pripojeni kabelu klavesnice). V OBP se zada prikaz "sync",
ten udela neco normalne nepovoleneho, a jadro "spusti" paniku a ulozi
svuj obraz do swapu (presneji: na dump device). Po opetovnem
nabootovani se obraz jadra prikazem savecore prenese do souboru a je
mozne delat jeho analyzu. V pripade Solarisu se to prilis casto nedela
(v CR). Solaris je sice liny, ale pomerne stabilni OS a navic je to
pomerne draha zalezitost (porizeni Windows 95 vyjde levneji a Windows
NT v nekterych pripadech take ;-) ) V prubehu dvou let jsem to delal
jen jednou a to se navic ukazalo, ze to neni problem jadra ...

Na PC schazi ten Open Boot PROM. Sice mam Bios ve stylu MS-Windows
(prekryvajici se okenka, obsluha mysi), ale radsi bych mel ten OBP.
Sice to neni tak efektni, ale da se s tim delat vic veci ...

BTW: Linux (RedHat 4.1) mi zatim zatuhl jen jednou, pri pristupu na
souborovy system Windows 95 pres sit (pres smbfs). Pres sambu se mi
take nepodarilo prenest soubor o velikosti asi 200MB z CD pocitace
kdesi na Internetu - vzdy to vypadlo na nejaky I/O error. Nakonec jsem
to prenesl na kolegovo PC s Win95 a odtamtud pres ftp. Jinak mam
uptime az 30 dni (jednou za mesic se tu vypina proud).

-- 
Alexandr Malusek (malusek na ujf.cas.cz)
UJF AV CR


Další informace o konferenci Linux