Script na parsovani souboru kvuli internetovym adresam? (dodatek)

Alexei Sveshnikov sveshnik na fzu.cz
Čtvrtek Duben 17 13:56:52 CEST 2003


> On Wed, 16 Apr 2003, [iso-8859-2] Ing. Vlastimil Pospíchal wrote:
> 
> > Jak tak na to koukám, nakonec bude stačit jeden řádek Perlu, který si poradí
> > i s těmi duplicitami. Naučit se regulární výrazy se určitě vyplatí.
> 
> Mohl byste se o ten jeden radek podelit ? Docela by me zajimalo prave to
> jak se vyporadate s duplicitami.
S duplicitami se da vyporadat pomoci hashe. Nasledujici reseni nevejde na
jeden radek jenom proto, ze regularni vyraz je prilis dlouhy:

while (<>) {
  chomp;
  if (m\(((https?|ftp|gopher)://|(mailto|file|news):)[^' <>"]+|(www|web|w3).[-a-z0-9.]+)[^' .,;<>":]\) { 
    $hash{$&}=0;
  }
}
foreach $key (keys %hash) { 
 print $key; print "\n";
}

> Diky
> 
> --
> -- Tomas Kouba

Alexej Sveshnikov



Další informace o konferenci Linux