Re: Problém se sítí na kernel >2.6.13.x (delší - komplexnější problém)

Petr Baláš petr.balas na gmail.com
Neděle Květen 7 23:00:35 CEST 2006


On 5/7/06, Jaroslav Prodelal <ogee na oldany.cz> wrote:
> Dobrý den!
>
>    Mám desku Asus (A8N-SLI Premium) s chipsetem NVIDIA nForce4 SLI a na
> ní AMD Athlon(tm) 64 X2 Dual Core Processor 4400+ se 4GB RAM. Deska má 2
> síťovky - jednu od Nvidia, druhou Marvell Yukon. Ten Marvell jsem
> zakázal a místo něj dal Intel Corporation 82541PI Gigabit Ethernet
> Controller (jedná se o 1000GT Desktop).
>
>    Funkční jádro, na kterém to běží je 2.6.13.5. Protože je tam ale
> nějaký problém s IOMMU a po nějakém čase po restartu po začne vypisovat
> dma_map_sg overflow a pak to jednoho dne vytuhne úplně na kernel panic
> nebo to prostě jenom nemůže zapsat na disk s tím, že dma_map_area
> overflow, tak jsem chtěl dát jiné jádro, zkoušel jsem (již několikrát)
> 2.6.14, 2.6.15 i nejposlednější 2.6.16.14.
>
>    Problém ale spočívá v tom, že ta síťovka Intel (dělal to ale i ten
> Marvell předtím když tam byl, což je na tom nejpodivnější), která se
> používá k propojení P2P s druhým totožným serverem nefunguje. Resp.
> nechá se nastavit, ale komunikace není možná - když pustím ping na ten
> druhý stroj a dám na něm tcpdump, tak vidím, že občas něco projde, ale
> ty pakety bývají buď poškozené a nebo hlavně ten druhý stroj vůbec
> nepošle odpověď. Většinou ale neprojde ani paket, takže je to nefunkční.
> Co mi nejde do hlavy je hlavně to, že ta jedna síťovka (Nvidia) funguje
> - tím je to připojené do inetu - a ta druhou, ať to byl ten Marvell nebo
> teď Intel, se kterým nebyly nikdy žádné problémy na jiných strojích,
> prostě nechce fungovat.
>
>    Konflikty IRQ a takové podpobné hlouposti jsem již hledal. Jsem úplně
> bezradný, vůbec nechápu co s tím a jak z toho ven. :-(
>
>    Posílám výpis z lspci -vv o té Intel kartě.
>
> 05:06.0 Ethernet controller: Intel Corporation 82541PI Gigabit Ethernet
> Controller (rev 05)
>         Subsystem: Intel Corporation: Unknown device 1376
>         Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop-
> ParErr- Stepping- SERR- FastB2B-
>         Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=medium >TAbort-
> <TAbort- <MAbort- >SERR- <PERR-
>         Latency: 32 (63750ns min), Cache Line Size 08
>         Interrupt: pin A routed to IRQ 18
>         Region 0: Memory at db020000 (32-bit, non-prefetchable) [size=128K]
>         Region 1: Memory at db000000 (32-bit, non-prefetchable) [size=128K]
>         Region 2: I/O ports at a000 [size=64]
>         [virtual] Expansion ROM at c2000000 [disabled] [size=128K]
>         Capabilities: [dc] Power Management version 2
>                 Flags: PMEClk- DSI+ D1- D2- AuxCurrent=0mA
> PME(D0+,D1-,D2-,D3hot+,D3cold+)
>                 Status: D0 PME-Enable- DSel=0 DScale=1 PME-
>         Capabilities: [e4] PCI-X non-bridge device.
>                 Command: DPERE- ERO+ RBC=0 OST=0
>                 Status: Bus=0 Dev=0 Func=0 64bit- 133MHz- SCD- USC-,
> DC=simple, DMMRBC=2, DMOST=0, DMCRS=0, RSCEM-

Jako radu na problemy s e1000 jsem nasel doporuceni vypnout segment offloading:
ethtool -K eth0 tso off
ale u me to stejne nevedlo ke spolehlive cinnosti - sitovka se obcas
na chvili zasekava
ale mam novejsi revizi:
0000:01:00.0 Ethernet controller: Intel Corp.: Unknown device 108c (rev 03)

Na nove Marvelly neni primo v jadre ovladac, je nutne pouzit patch
primo od Marvellu.


--
Petr Baláš - petr.balas at gmail dot com


Další informace o konferenci Linux