Pracujete s jazykem R a potřebujete vizualizovat zeměpisná data České republiky? Jindřich Lacko v depozitáři tzv. R balíčků publikoval svůj, který pojmenoval RCzechia.
Důvody pro vytvoření
Jindřich Lacko na svém blogu popisuje důvody, proč balíček vzniknul.
„Při práci s geografickými daty v kontextu České republiky jsem narazil na to, že Rkový svět je hodně stavěný na realitu anglicky hovořících zemí, zejména Ameriky. Je mnoho a mnoho zdrojů pro kreslení územních celků a celečků USA, ale naše obce a okresy aby člověk hledal s Jiráskovo lucernou.
K dispozici sice je Arc500, se kterým se z Rka dá přes rgdal jakž takž pracovat – ale není to ani úplně uživatelsky vstřícné, ani triviální (například použitý způsob kódování češtiny jsem vůbec nepochopil, a souřadnicový systém ing. Křováka je poněkud folklórní téma).
Tak jsem si shapefily upravil a přetvořil do datové package RCzechia, kterou tímto nabízím k použití. Souřadnicový systém je převedený z Křováka na WGS84, které se více kamarádí s google aplikacemi a Rkovými knihovnami.
Z technických příčin (CRAN přijímá balíčky pouze do velikosti 5 MB) nebylo možné objekty uložit v rámci package, a musím je volat externě (technicky jsou uložena na Amazon S3). Práce s packagí tudíž vyžaduje fungující intenetové spojení, a některé objekty – největší potížisté jsou polygony obcí s 36 MB – se mohou stahovat déle. Za zařazení package na CRAN mi to přišlo jako přijatelná cena.“
Obsah R balíčku Czechia
- republika: hranice České republiky.
- kraje: 14 krajů České republiky, včetně Hlavního města Prahy.
Klíč pro připojení dat je KOD_CZNUTS3 (kód kraje). - okresy: 76 okresů České republiky + Praha (která technicky není okres).
Klíč pro připojení dat je KOD_LAU1 (kód okresu). - orp_polygony() 206 obcí s rozšířenou působností (trojkové obce).
Klíč připojení dat je KOD_ORP. - obce_polygony: 6.258 obcí a vojenských újezdů České republiky.
Klíč pro připojení dat je KOD_OBEC, v datech jsou navíc informace o příslušné obci s pověřeným obecním úřadem (tzv. dvojkové obce – KOD_POU, respektive NAZ_POU) a příslušné obci s rozšířenou působností (tzv. trojkové obce – KOD_ORP, respektive NAZ_ORP). - obce_body stejné jako obce polygony, ale pouze středy.
- casti: primárně 57 městských částí Hlavního města Prahy, ale části jsou i pro Brno a další města.
Klíč pro připojení dat je KOD. - reky: Řeky České republiky. Přidáním do mapy pomohou základní orientaci.
- plochy: Vodní plochy České republiky. Přidáním do mapy pomohou základní orientaci.
Všechny objekty jsou technicky realizovány jako funkce vracející data frame, a volají se proto se se závorkami.
Příklady použití
Jindřich Lacko ukazuje na příkladech, jak se jeho balíček dá použít. Můžete například vizualizovat počet obyvatel po okresech, dohledat body a zakreslit souřadnice na mapě, ukázat nezaměstnanost v jednotlivých obcích České republiky, nebo zjistit vzdálenost z Prahy do Brna.
[převzato se svolením autora z blogu Jla-data.net]