O statistických datech
Databáze jsou naplněny statistickými daty, které byly buď získány již v elektronické podobě, nebo byly zejména v případě starších dat digitalizovány z dobových statistických publikací. Rešerše statistických dat proběhla ve více než dvou desítkách institucí, archivů a knihoven, které uchovávají dobové publikace ze sčítání lidu i další publikace s průběžnými statistikami. Využity byly zejména publikace a přepisy dat z Českého statistického úřadu a jeho knihovny, z Národní knihovny, Geografické knihovny PřF UK, ze Sociologického ústavu apod.
Statistická data byla zpracována zejména digitalizací pramenných publikací Sčítání lidu, domů a bytů a dalších průběžných statistik s důrazem na období od roku 1921 do současnosti. K digitalizaci byla primárně použita technologie OCR. Pokud mechanické poškození některých zvláště starších publikací neumožňovalo použití sofistikovaných technologických postupů, byla data ručně přepsána do elektronické podoby. Následně byla data setříděna a vybrány zejména ukazatele, které byly sledovány v co největším počtu sčítání lidu, aby bylo umožněno porovnání v co nejširším časovém horizontu. K nim byly vybrány další důležité ukazatele. Vybraná statistická data (ukazatele) byla následně opatřena specifickým kódem, který primárně odlišuje ukazatele vztahující se k obyvatelstvu (o_), bydlení (b_) a k sídelnímu systému (s_). Další znaky odkazují na tematické zařazení ukazatele (např. zkratka _nab_ na náboženskou strukturu apod.) a jeho podrobnější zatřídění (u věkové struktury např. na konkrétní věkové skupiny). Systém kódů statistických dat (ukazatelů) je stejný ve všech letech sčítání, což usnadňuje orientaci v datech a práci s nimi a uživatelům je plně k dispozici v přiložených metadatech.
Data byla následně připojena v podobě atributové tabulky do prostorové databáze, včetně informace o konkrétních publikacích, ze kterých byl každý ukazatel převzat. Tímto postupem vznikly finálně dvě geodatabáze historických statistických a prostorových dat (za Česko a Prahu) pro všechna sčítání lidu v období 1921‒2011. Geodatabáze jsou uživatelům volně dostupné na webovém portálu projektu www.historickygis.cz ve třech formátech: (i) Geodatabáze pro náročnější uživatele Geografických informačních systémů, (ii) Shapefile pro méně náročné uživatele, (iii) Excel, kde jsou přístupná pouze statistická data v prostorové struktuře bez polygonových vrstev.
Vytvořené geodatabáze propojují prostorová a statistická data a umožňují zobrazit historická populační data v prostředí GIS tak, jak je vidět na jednotlivých mapových listech Historického populačního atlasu českých zemí nebo na příkladu specializovaných map, které jsou veřejně přístupné na portálu https://www.atlasobyvatelstva.cz/historie.
Prostorová a statistická data je možné po registraci stáhnout ZDE