Spolehlivost virtualniho HW
Pavel Kankovsky
peak na argo.troja.mff.cuni.cz
Pátek Březen 23 11:39:52 CET 2012
On Fri, 23 Mar 2012, Jaroslav Lukesh wrote:
> Představte si kus kódu, který dlouhou dobu funguje, ale najednou
> z ničeho nic, nikde žádná změna, fungovat přestane a vy nevíte proč.
Žádná změna? To jako že to ve virtuálním stroji stejného typu běželo už od
začátku?
> Přesně takto se chová linux na vadném HW kdy třeba na ls zahlásí že
> soubor ls neexistuje.
To bych si dovolil tvrdit, že není úplně typický projev vadného hardwaru.
Spíš dost atypický. Stát se to samozřejmě může, pokud se data v paměti
nebo na disku šikovně poškodí, ale moc pravděpodobné to není. A pokud
k tomu dochází, tak by to neměl být jediný projev, mělo by to mizet a zase
se objevovat (jako se data různě kešují), mělo by docházet k poškození
jiných dat...
> Toto ale není jediný případ, podivnosti se děly už při instalaci, takže
> celý server je prošpikovaný různými symlinky na knihovny na jiném místě
> a skripty, které ho udržují funkční, protože některé knihovny na disku
> jakoby vůbec neviděl (disk je samozřejmě virtuální).
Co tím chcete říct, že knihovny nejsou vidět, dokud na ně nevyrobíte
symlink odjinud?
Tak to bych opravdu nehledal chybu v hardwaru (třeba i virtualizovaném),
protože pro přístup přes symlink musí fungovat *současně* nalezení a čtení
symlinku i nalezení a čtení cílového souboru, což je víc, než je
požadováno při přímém přístupu.
Pokud to chcete vyřešit, tak bych doporučil vzít jeden případ, kdy se
stane něco divného, ke kterému dochází dostatečně často (nejlépe
deterministicky na vyžádání) a zkoumat ho systematicky krok po kroku (kód
programu, kód knihovny, jádro, ovladač...) a hledat, proč se tam dějí
špatné věci.
--
Pavel Kankovsky aka Peak / Jeremiah 9:21 \
"For death is come up into our MS Windows(tm)..." \ 21st century edition /
Další informace o konferenci Linux