Spolehlivost virtualniho HW

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Pátek Březen 23 11:39:52 CET 2012


On Fri, 23 Mar 2012, Jaroslav Lukesh wrote:

> Představte si kus kódu, který dlouhou dobu funguje, ale najednou 
> z ničeho nic, nikde žádná změna, fungovat přestane a vy nevíte proč.

Žádná změna? To jako že to ve virtuálním stroji stejného typu běželo už od 
začátku?

> Přesně takto se chová linux na vadném HW kdy třeba na ls zahlásí že 
> soubor ls neexistuje.

To bych si dovolil tvrdit, že není úplně typický projev vadného hardwaru. 
Spíš dost atypický. Stát se to samozřejmě může, pokud se data v paměti 
nebo na disku šikovně poškodí, ale moc pravděpodobné to není. A pokud
k tomu dochází, tak by to neměl být jediný projev, mělo by to mizet a zase 
se objevovat (jako se data různě kešují), mělo by docházet k poškození 
jiných dat...

> Toto ale není jediný případ, podivnosti se děly už při instalaci, takže 
> celý server je prošpikovaný různými symlinky na knihovny na jiném místě 
> a skripty, které ho udržují funkční, protože některé knihovny na disku 
> jakoby vůbec neviděl (disk je samozřejmě virtuální).

Co tím chcete říct, že knihovny nejsou vidět, dokud na ně nevyrobíte 
symlink odjinud?

Tak to bych opravdu nehledal chybu v hardwaru (třeba i virtualizovaném), 
protože pro přístup přes symlink musí fungovat *současně* nalezení a čtení 
symlinku i nalezení a čtení cílového souboru, což je víc, než je 
požadováno při přímém přístupu.

Pokud to chcete vyřešit, tak bych doporučil vzít jeden případ, kdy se 
stane něco divného, ke kterému dochází dostatečně často (nejlépe 
deterministicky na vyžádání) a zkoumat ho systematicky krok po kroku (kód 
programu, kód knihovny, jádro, ovladač...) a hledat, proč se tam dějí 
špatné věci.


-- 
Pavel Kankovsky aka Peak                          / Jeremiah 9:21        \
"For death is come up into our MS Windows(tm)..." \ 21st century edition /


Další informace o konferenci Linux