Databáze KROK – otevřená data - dokumentace
Databáze KROK – otevřená data
Databáze KROK obsahuje agregovaná statistická data za Českou republiku, regiony soudržnosti, kraje, okresy a správní obvody obcí s rozšířenou působností. Údaje jsou seskupeny do samostatných ročních souborů a prezentují data za uvedené územní celky od roku 2000 do současnosti. Data se vztahují vždy k aktuální územní struktuře platné v příslušném roce. Datový soubor za každý rok je po prvním zveřejnění následně ještě jednou aktualizován.
V souborech jsou zastoupeny různé obory statistiky představující tyto okruhy:
-
Území, katastrální výměry
-
Osídlení
-
Obyvatelstvo
-
Ekonomické subjekty
-
Nezaměstnanost (kraje, okresy)
-
Pracovní síla a ekonomicky neaktivní obyvatelstvo (VŠPS)
-
Průmysl
-
Zemědělství
-
Stavebnictví
-
Bytová výstavba
-
Doprava a dopravní síť
-
Zdravotnictví, pracovní neschopnost
-
Důchodové zabezpečení
-
Kriminalita, dopravní nehody, požáry
-
Hospodaření krajů
-
Školství
-
Sociální služby
-
Sčítání lidu, domů a bytů 2001, 2011, 2021
-
Nezaměstnanost (SO ORP)
Celkový počet ukazatelů v těchto statistických okruzích je 1 252.
Číselník ukazatelů obsahuje kromě kódu a názvu ukazatele také další informace, včetně zdroje dat a metodického vymezení jednotlivých ukazatelů. Vyskytují se v něm následující zdroje dat:
-
ČSÚ – Český statistický úřad
-
ČSSZ – Česká správa sociálního zabezpečení
-
ČÚZK – Český úřad zeměměřický a katastrální
-
GŘ Úřadu práce ČR – Generální ředitelství Úřadu práce ČR
-
HZS ČR – Hasičský záchranný sbor ČR
-
MD ČR – Ministerstvo dopravy ČR
-
MFIN ČR – Ministerstvo financí ČR
-
MPSV ČR – Ministerstvo práce a sociálních věcí ČR
-
MŠMT ČR – Ministerstvo školství, mládeže a tělovýchovy ČR֪
-
Policejní prezidium ČR – Policejní prezidium ČR
-
ŘSD ČR – Ředitelství silnic a dálnic ČR
-
ÚZIS – Ústav zdravotnických informací a statistiky ČR
Číselník území má pevnou strukturu kódů území, tzn., že územní struktura je považovaná za neměnnou za celé období od roku 2000 po současnost. Územní změny v krajích, okresech a SO ORP, pokud k nim došlo, jsou promítnuté v datech příslušného roku a v letech následujících. Zpětné přepočty dat nejsou prováděny.
Seznam a struktura souborů
1. KROK_DATA_rrrr – datový soubor, kde rrrr je údaj roku
-
ROK - údaj roku
-
KODUKAZ - šestimístný kód ukazatele
-
KODUZEMI - čtyřmístný kód území
-
HODNOTA - číselný údaj nebo "i.d." pro chráněný údaj
2. KROK_UKAZ – číselník ukazatelů
-
KODUKAZ - šestimístný kód ukazatele
-
NAZEV - název ukazatele
-
MJ - měřicí jednotka
-
PLATIOD - platí od roku
-
PLATIDO - platí do roku
-
OKRUH - dvoumístný kód okruhu
-
ZDROJ - primární zdroj dat (s eventuálním upřesněním)
-
VERIFIKACE_CSU - pokud je uvedeno "ano", ČSÚ data z primárního zdroje zpřesňoval
-
METODIKA - metodické vymezení ukazatele
3. KROK_UZEMI – číselník území
-
KODUZEMI - čtyřmístný kód území
-
UZEMI - název území
-
TYPUZEMI - pojmenování typu území textově
4. KROK_OKRUHY – seznam statistických okruhů dat
-
KOD - dvoumístný kód okruhu
-
NAZEV - název okruhu
Soubory jsou ve formátu CSV a splňují standardy otevřených dat, konkrétně tyto požadavky:
-
Soubor CSV má kódování UTF-8 (ve variantě bez BOM)
-
Jednotlivé řádky jsou zapsány jako řádky textového souboru oddělené pomocí CRLF (znaky s UTF-8 kódy U+000D U+000A)
-
Údaje v řádku jsou zapsány jako řetězce oddělené čárkou (znak , s UTF-8 kódem U+002C)
-
Uvozovka v textech je zdvojená, tj. místo " je zapsána jako ""