V tomto pokračování série článků o centrálním datovém skladu (CDS) se podíváme do „kuchyně“ tohoto pracoviště a na to, jaké operace se s daty od převzetí po distribuci provádí. Jak již bylo zmíněno v předchozích dílech, data do datového skladu přichází v různých formátech. Pro názornost lze vyjmenovat několik z nich:
- shp (shapefile),
- fgdb (File Geodatabase),
- DGN,
- xls (tabulka Excel),
- xml (výstupy z databází, registry).
Kromě formátu se data liší také souřadnicovým systémem přiřazeným pro jejich prostorové zobrazení. Opět pro názornost nejčastěji používané:
- S-JTSK / Krovak East North
- WGS-84
- ETRS 89
Dále je třeba upozornit, že geodata si kromě geometrické části (bod, linie, polygony) nesou rozsáhlé informace v atributech.
Jednou ze základních otázek při budování a rozvoji pracoviště datového skladu bylo, jak dosáhnout při tomto širokém spektru „odlišností“ jednotnosti a kontinuity během distribuce do jednotlivých systémů HZS ČR a IZS. Základním prvkem je již několikrát zmiňovaný přesně stanovený datový model, který jasným způsobem definuje požadavky na jednotlivá data co do formátu, souřadnicového systému a pevné atributové podoby.
Je třeba si uvědomit, že data po zpracování v CDS HZS ČR neslouží „pouze“ k tvorbě mapového projektu, tzn. vizualizaci dat (např. ve formě podkladové mapy, viz.obr 2), ale zvláštní důraz je kladen na data určená pro vyhledávání (vyhledávací databáze).
Tato data při zpracování vyžadují velkou pozornost s ohledem na atributovou část, kde dochází k přiřazení a dopočítání různých vazebných položek s cílem maximálního využití těchto dat.
Nyní se dostáváme ke konkrétním krokům, které probíhají v datovém skladu při každé aktualizaci stávajících datových sad nebo obdržení dat nových. Jak vyplývá z obrázku 3, jádrem datového skladu je databázové úložiště geodat .
V rámci CDS HZS ČR je jako toto úložiště využívána databáze Oracle a databázový formát fgdb (File Geodatabase) fy. ESRI. Na úložiště navazuje technologická platforma ArcGIS for desktop a ArcGIS for Server (Standard a Enterprise) – na této SW platformě (ESRI) byly procesy s daty budovány a postupně zdokonalovány.
Nyní se podívejme na jednotlivé kroky zpracování dat:
1. krok – po obdržení od dodavatelů jsou zdrojová data umístěna do úložiště. Zde jsou spuštěny aktualizační skripty (obrázek 4) jako součást ETL procesů (extract, transform, load), které data rozbalí, transformují a uloží do databáze s interním názvem „pracovní prostor“.
2. krok – v této fázi probíhá největší množství procesů. Na počátku dochází ke kontrolám a dále se data upravují dle zmiňovaného datového modelu. Na závěr dojde k výstupním kontrolním procesům, které jsou schopny odhalit případné chyby vzniklé při zpracování.
3. krok – tato fáze je předznamenána přesunem dat do databázového úložiště nazvaného „datový sklad“ pomoci tzv. „datové pumpy“. Zde se již nachází data zpracovaná, vyčištěná, v přesně odpovídajících datových modelech. Takto upravená a uložená data jsou připravena pro distribuci do jednotlivých systémů HZS ČR v předepsaných distribučních periodách, dále jsou využívána k publikování ve formě webové služby a v neposlední řadě slouží k provádění různých prostorových analýz.
Cílem pracoviště centrálního datového skladu v IOO LB (Institut ochrany obyvatelstva Lázně Bohdaneč) je podřídit veškerou činnost ve prospěch podpory GIS v rámci HZS ČR a IZS. Tento cíl je plněn tím, že geografická data jsou poskytována:
- vždy aktuální,
- kompletní,
- bezchybná
- v rozsahu datových modelů stanovených uživateli.
V následující části článku se budeme zabývat praktickým využitím dat ve vztahu k webové aplikaci – tenkému mapovému klientovi.
pplk. Ing. Zdeněk Červenka (MV GŘ HZS ČR – Institut ochrany obyvatelstva Lázně Bohdaneč)