Možná se vám to stává také. Čtete nějaký text a narážíte na spoustu pojmenování míst, o kterých ani nevíte, kde se nacházejí, a vy to vědět chcete nebo potřebujete. Buď sáhnete po mapě nebo atlasu, nebo sednete k internetu a jednotlivá místa postupně vyhledáte.
A nebo… na adrese http://geoparser.kraj-lbc.cz spustíte novou aplikaci s tajemným jménem GEOPARSER a vložíte studovaný text.
Co se bude dít? Geoparser načte váš text, vyhledá v něm všechna slova, která by mohla být geografickými názvy, určí, jaké jsou kategorie, zda se jedná o obec, přírodní památku, historickou památku, vodní dílo a zobrazí vyhledaná místa barevně rozlišenými ikonkami na mapě.
A jaké jsou výhody použití Geoparseru? Hlavní výhodou je, že pracuje automaticky. Prohledá celý vstupní text a najednou v mapě zobrazí všechny geografické lokality zmiňované v textu. Uživatel se pak může pohybovat libovolně mezi mapou a textem a naopak.
V čem je Geoparser unikátní? Zejména tím, že automaticky rozeznává i skloňovaná jména lokalit. Vyhledá v textu nejen „Liberec“, ale i „Liberce“, „Libercem“ - to zatím žádný jiný český vyhledávač nedokáže. Vyhledá také víceslovná spojení (například „Mokřady Liběchovky“), odvozená slova („Liberecko“), ale i neúplné nebo zkrácené názvy („Jablonec“, „Jablonec n. N.“).
Jaké jsou možnosti vstupu textu? Buď zadáte přímo webovou adresu (například http://www.kraj-lbc.cz , http://cestovani.idnes.cz …) nebo můžete z webové stránky nebo dokumentu zkopírovat a vložit do Geoparseru jen vybranou část textu. Můžete ale také ze svého disku načíst celý dokument ve formátu DOC, TXT nebo PDF.
Jak Geoparser pracuje? Základem jsou vložené databáze geografických názvů. Jsou využity základní databáze veřejné správy - Geonames (databáze místních názvů, správce ČÚZK), DIBAVOD (vodohospodářská databáze, správce VÚV Praha) a TopoČR firmy Help Service Benešov. Geoparser převede vstupní text do formátu HTML, proběhne porovnání vstupního textu s databází geografických názvů, shodné výsledky jsou s využitím nové technologie, tzv. mikroformátů, zobrazeny v mapě.
Aplikace Geoparser je prvním prototypem geoparseru pracujícího s českým jazykem. Testovaná verze detailně pracuje s místními názvy z Libereckého kraje (zde rozliší i typ lokality) a na úrovni jmen obcí pak s geografickými názvy z celé České republiky. Záleží, kterou srovnávací databázi si při zpracování textu zaškrtnete.
Postup práce s aplikací:
Ing. Irena Košková
správa GIS a mapových serverů životního prostředí
Krajský úřad Libereckého kraje
U Jezu 642/2a * 461 80 Liberec 2
tel.: +420 485 226 412, +420 739 541 626
e-mail: irena.koskova@kraj-lbc.cz * //iszp.kraj-lbc.cz * //maps.kraj-lbc.cz