Script na parsovani souboru kvuli internetovym adresam? (dodatek)
Alexei Sveshnikov
sveshnik na fzu.cz
Čtvrtek Duben 17 13:56:52 CEST 2003
> On Wed, 16 Apr 2003, [iso-8859-2] Ing. Vlastimil Pospíchal wrote:
>
> > Jak tak na to koukám, nakonec bude stačit jeden řádek Perlu, který si poradí
> > i s těmi duplicitami. Naučit se regulární výrazy se určitě vyplatí.
>
> Mohl byste se o ten jeden radek podelit ? Docela by me zajimalo prave to
> jak se vyporadate s duplicitami.
S duplicitami se da vyporadat pomoci hashe. Nasledujici reseni nevejde na
jeden radek jenom proto, ze regularni vyraz je prilis dlouhy:
while (<>) {
chomp;
if (m\(((https?|ftp|gopher)://|(mailto|file|news):)[^' <>"]+|(www|web|w3).[-a-z0-9.]+)[^' .,;<>":]\) {
$hash{$&}=0;
}
}
foreach $key (keys %hash) {
print $key; print "\n";
}
> Diky
>
> --
> -- Tomas Kouba
Alexej Sveshnikov
Další informace o konferenci Linux