PDOK NLMaps

In deze datablogs voor Hack de Toekomst lichten wij steeds een dataset uit ter voorbereiding op de hackathon. In deze datablog een aantal geodata sets, en hoe die te visualiseren.

Context

Visualisatie van data op een kaart kan data beter inzichtelijk maken, mits de data ervoor is geschikt. Alle data die gaat over postcodes, buurten, wijken, gemeenten, arbeidsregio’s, provincies of instellingslocaties is geografisch weer te geven. Wel moet je opletten om absolute aantallen te corrigeren voor bijv. populatie (of werkgelegenheid), als je dit niet doet krijg je vaak een kaart die gelijk is aan een populatiekaart.

Van de Samenwerkingsorganisatie Beroepsonderwijs Bedrijfsleven (SBB) hebben we een aantal unieke datasets gekregen, o.a. met leerplaatsen op postcodecijfer (PC4, de eerste 4 tekens van de postcode) niveau en een dataset met per instelling en opleiding het aantal stages per woongemeente en stagegemeente.

Visualisatie

Voor een visualisatie van de eerste dataset op postcodecijferniveau (PC4) hebben we de postcodevlakken nodig, deze worden op PDOK gepubliceerd namens het CBS. Deze is in ESRI shape formaat, deze hebben wij reeds met een aantal stappen omgezet naar een GeoJSON formaat.
Vervolgens biedt PDOK via NLmaps een makkelijke manier om de Basisregistratie Grootschalige Topografie (BGT) achtergrondkaarten in een verschillende web-kaartviewers te gebruiken. Het is handig een neutrale (grijze) achtergrondkaart te pakken als je gekleurde data wilt visualiseren.

De data verwerken kan op vele manieren, enkel met de command line interface (hier een gratis online cursus), je favoriete programmeertaal, maar ook in LibreOffice of Microsoft Excel kan je data verwerken om later geografisch te visualiseren. Door bijv. een pivot tabel te gebruiken of SUMIF voor elke postcode/gemeente, vervolgens kan je deze koppelen aan de geografische vormen van een postcode/gemeente en dan als CSV weer omzetten naar GeoJSON.

Als eerste opzet kunnen we de stages per postcode (PC4) op een kaart zetten, met een kleine bewerking krijg je deze kaart:

Het probleem is dat postcodegebieden niet even groot zijn, en er daarom vertekening is, helaas levert het delen door inwoners juist een nog vertekender beeld op omdat op plekken als Schiphol juist weinig mensen wonen. We zouden dus moeten corrigeren voor het aantal banen, echter is deze data niet als open data op postcodeniveau beschikbaar. Zowel LISA als het CBS hebben de data wel open beschikbaar op gemeenteniveau. Na een paar kleine bewerkingen (vanwege gemeentelijke herindelingen) krijgen we de volgende kaart:

De gebruikte datasets, code en bewerkingsstappen van deze kaarten zijn op github beschikbaar.

De geografische vervolgvragen bij de data:

  • Hangt het af van de studie of opleidingsniveau hoe ver mensen reizen naar Apeldoorn?
  • Welke opleidingen vinden stages in Apeldoorn en welke juist niet, ook vergeleken met andere gemeenten?