Velky provoz na routeru (fwd)

Josef Belkovics belkovic na oudec.osu.cz
Sobota Duben 24 02:30:03 CEST 1999


> ---------- Forwarded message ----------
> Date: Thu, 22 Apr 1999 17:20:59 +0200
> From: Jakub Dadak <dadman na brainsys.cz>
> To: linux na linux.cz
> Subject: Velky provoz na routeru
> 
>     jeden z nasich firemnich routeru mi pri velkem zatizeni site
> (napr. kopirovani 1 GB dat) zpusobi, ze jedna z jeho sitovych karet
> (pokazde jina) se dostane do stavu, kdy ping pres ni ma vypada tak, ze
> 1. paket dojde za 0.2 ms, 2. za 4 sec, 3. za 3 sec, 4. zase treba za 0.5
> ms a tim se stane sit prakticky nepouzitelna. Pomuze pouze 
> ifdown eth0 a ifup eth0. Nevite kde by mohl byt zakopany pes ?
> 
> Soucasna konfigurace.
> 
> 2 x Epic 100 tj. SMC 2543 TX (tusim)
> 1 x 3c509 
> 1 x SDL Riscom N2 - dvouportova seriova synchronni karta
> 1 x Moxa 168C - 8 portova seriova asynchronni karta
> 
> P200 MMX, 64 MB RAM, Redhat 5.1
> 
> Delalo to i s kartami tulip (DEC 21040), 3c905b, Ovis link s RTL chipem.
> 
> Mam tuseni ze to bude mit nejakou spojitost s tim seriovym hardwarem.
> Apropos nevite jaky ma vliv na chod napr. umisteni karet v PCI slotech ?
> Bus mastering apod.

Mam P5/66, 64 MB, 2x 3c905 (pci), 4x 3c509 (isa), FreeBSD 3.1. Na vsech
kartach smeruji ip a ipx. Karty 3c509 se dostavaji do stavu OACTIVE a
pomuze jedine 'ifconfig ep? down + ifconfig ep? up' - tedy presne totez co
pod linuxem. Karty 3c905 jsou bez problemu.

Mam velky provoz: 100 - 3000 paketu za vterinu, prumer 700 (dlouhodobe 
"mereno" 'systat -vmstat 1', meze jasne, prumer od oka).
Vim 100% dve veci (syslog aj.):
a) stav OACTIVE nezavisi na velikosti provozu
b) stav OACTIVE nezavisi na seriovych kartach (na stejnem pocitaci byly 
   donedavna seriove karty riscom/n2 a cyclom-Ye)

Protoze chyba je pod linuxem i fbsd, jsou dve (nevylucujici se) moznosti:
a) driver ma stejny puvod a mozna i stejneho autora
b) problem je v 3c509 (firmware)

Dale vim:
a) spatne zkonfigurovany NetWorker zalohujici pod ipx shodi 3c509 po 
   nahozeni do 5 vterin (nevim, co je na nem spatne zkonfigurovano, hadam 
   ze 'retransmission timeout')
b) nebezi-li NetWorker, potom OACTIVE nastane _vzdy_, kdyz novell posila 
   spatne smerovaci informace (a gated se zlobi do syslogu)

Ja si hlidam OACTIVE pres malinky programek v bashi (typu '[X`ifconfig ep0
| grep OACTIVE` != X] && (ifconfig ep0 down ; ifconfig ep0 up)') a
dojde-li k chybe, zapisi to do logu - proto to vzdy. Na nasi siti novell
pouziva ramce ii, 802.2, 802.3 a fbsd umi jenom ii (presto to uz dva roky
chodi). 

Muj nazor je, ze 3c509 ma firmware z 1992 (mam 3c509 vyrobene 1992, 1994 a
1996, ale myslim si, ze firmware maji vcelku stejny) a od te doby novell
tak interne kouzlil s ramci, ze nektere novellacke pakety jsou pro 3c509
cernobylske pakety - a proto karty typu 3c905(b) jsou ok, protoze jsou
nove a byly testovany na 'novem' novellu. 

Spravnou odpoved muze dat jenom autor driveru a protoze ja nyni neodbiram
fbsd konferenci (a ani linux), pisi to timhle 'mimochodem' stylem. 
Bude-li mi nekdo odpovidat, piste na: 

belkovic na osu.cz
Josef Belkovics


Další informace o konferenci Linux