Zpusoby pripojeni storage - zkusenosti

Pavel Kankovsky peak na argo.troja.mff.cuni.cz
Úterý Březen 2 19:10:40 CET 2010


On Tue, 2 Mar 2010, Jan Kasprzak wrote:

> - o FCoE se pise treba tady:
> 	http://www.abclinuxu.cz/clanky/hardware/fcoe-fibre-channel-over-ethernet
> 	- vypada to ze je to dost bastl (vyzadovani jumbo frames, PAUSE,
> 	priority provozu - v podstate si z ethernetu delaji spolehlive
> 	potvrzovane medium). Nelibi se mi to.

FCoE funguje afaik tak, že z FC odebrali fyzickou a linkovou vrstvu a
nahradili jí ethernetem. Což znamená, že to potřebuje umět posílat velké
rámce (proto ty jumbo frames) a musí to dělat congestion control, který ve
FC zařizují nižší vrstvy (proto pauzování a priority; nezajišťuje to
spolehlivost proti ztrátám obecně, hlavně to brání tomu, aby k nim
docházelo kvůli zahlcení).

>	Navic to snad potrebuje 10GbE kartu s jinym firmwarem nez je
> 	pro ethernet.

Zřejmě to potřebuje NIC, který má podporu pro Data Center Bridging. Což se
zdá, že je v tuto chvíli na Linuxu jen intelí desetigigová "ixgbe".
Hypoteticky by to šlo provozovat i bez toho (až na svou velikost jsou to
normální eth. rámce), ale muselo by s tím být srozuměno i zařízení na
druhé straně.

> - iSCSI pole jsem nevidel s 10GbE rozhranim (ale momentalne si nejsem jisty,
> 	jestli 10GbE nutne potrebuju).

Ona ta zařízení často mají víc rozhraní a jsou někdy v případně schopna i
mezi ně rozložit zátěž.

> - u nekterych stavajicich diskovych poli je problem s cachovanim - operacni
> 	system typicky potrebuje umet sam preskladavat pozadavky ve fronte,
> 	ale tohle nefunguje pokud je TCQ fronta zarizeni nebo jeho cache
> 	prilis velka - [...]

Nějaká zařízení, co jsem viděl, vesměs dovolovala nařídit cache
write-through a konfigurovat disponibilní počet tagů. Za velmi poučné
v tomto směru považuji dokumentaci, ze které je hned vidět, jaké věci tam
lze nakonfigurovat.

Jinak se říká, že než měnit délku fronty může být *někdy* lepší zkusit
změnit i/o scheduler. Ale praktické zkušenosti nemám.

> - mirne preferuju HW RAID (ale problemy z predchoziho bodu) kvuli tomu,
> 	ze radic pole na rozdil od kernelu potrebuje jen "vytahnout vadny disk
> 	a vlozit novy" a nic dalsiho se nemusi konfigurovat.

SW RAID se také dost obtížně používá v situaci, kdy má jedno pole sdílet
víc počítačů.


-- 
Pavel Kankovsky aka Peak                          / Jeremiah 9:21        \
"For death is come up into our MS Windows(tm)..." \ 21st century edition /





Další informace o konferenci Linux