handleiding-power-pivot-met-cbs-open-data-v2.pdf

Type: Document | Status: ready

CBS |Excel en open data services van StatLine 27

Decimals Aantal decimalen, alleen bij numerieke DataTypes, voorbeeld: 0, 1, 2 Default Omschrijving van de waarde die default is ingevuld wanneer hiervoor geen waarde is ingevuld, voorbeeld Zero, Impossible, Missing Presentationtype Alleen bij GeoDimension en GeoDetail t.b.v. het tonen van een kaart. Wanneer een onderwerp een numeriek datatype heeft, wordt hier aangegeven of dit Relative of Absolute is.

3.6 Relaties

Binnen de dataset wordt gewerkt met codes voor de bijbehorende dimensies. Om nu iets voor de mens leesbare informatie zichtbaar te krijgen is het noodzakelijk relaties te leggen tussen de dataset en de dimensies. Diagramweergave Om de relatie tussen de dataset en de dimensies te kunnen leggen, is de Diagramweergave goed te gebruiken. Deze Diagramweergave staat in het PowerPivot-lint.

Door het aanklikken van de Diagramweergave worden alle sheets met hun koppen in een overzicht zichtbaar.

Relaties leggen In de dataset komen Perioden voor. Hierin zijn de codes opgenomen die in de sheet Perioden als Key zijn opgenomen. Door vanuit sheet TypedDataSet het veld Periode te slepen naar Key van de de sheet Perioden wordt de reletie tussen deze twee sheets aangebracht.

Hetzelfde is van toepassing op de sheet TypedDataSet veld RegioS en de Key uit de sheet RegioS. Zoals in onderstaande afbeelding zichtbaar is, is standaard wel te zien dat een relatie gelegd is, maar niet welke tussen welke velden uit de twee sheets (zie de relatie tussen de sheets TypedDataSet en RegioS). Door op de relatie pijl te gaan staan en rechts te

CBS |Excel en open data services van StatLine 28

klikken, kan voor Relatie bewerken worden gekozen. Dan wordt en in de Diagramweergave en in de popup zichtbaar op welke velden de trelatie gelegd is (zie de relatie tussen de sheets TypedDataSet en Perioden in dezelfde afbeelding).

De dimensies, of ze nu gestandaardiseerd zijn of niet, hebben allemaal een Key, Title en Description. De vulling van de Description is optioneel. Door het veld in de dataset te verbinden met de key van de gelijknamige sheet, wordt altijde de juiste relatie gelegd. Wanneer binnen een draaitabel informatie gepresenteert wordt, kan dat de Title van de dimensie getoond worden.

CBS |Excel en open data services van StatLine 29

Bijlage 1: Gestandaardiseerde dimensies met meerdere indelingen Tijd- en Geo-dimensies zijn gestandaardiseerde dimensie. Dit betekent dat de indelingen volgens standaard richtlijnen zijn samengesteld en dat deze in iedere tabel die de gestandaardiseerde indeling gebruikt ook op dezelfde manier is uit te lezen. Deze dimensies kunnen ook meerdere indelingen bevatten. Binnen een tijd-dimensie kunnen bijvoorbeeld zowel maanden als jaren zijn opgenomen. Binnen de geo-dimensie kunnen bijvoorbeeld zowel landseden, provincies als gemeenten worden gebruikt. De indelingscode zit verwerkt in de Key kolom van de dimensie. Om op de indeling te kunnen selecteren kan deze met een DAX string functie eruit worden gefilterd. Bij een Geodimensie staat de codering op positie 1 en 2 van de Key. Bij een Tijd-dimensie staat de tijdcodering op positie 5 en 6 van de Key.

 Het type dimensie is te zien in de type kolom van DataProperties  De betekenis van de codering in de Key is terug te vinden is in Bijlage 4: Coderingen

Op de volgende pagina is een voorbeeld gegeven bij de Perioden dimensie. In de Perioden dimensie van de gebruikte tabel zit een indeling naar kwartaal en naar jaar. KW staat voor kwartaal en JJ staat voor jaar.

PowerPivot zet achter iedere tabel “Kolom toevoegen”. Door deze kolom te selecteren kan een functie worden ingevoerd. De functie kan gebruikmaken van de andere kolommen in de tabel. Bij het fx invoer veld kan de functie worden ingevoerd. In dit geval staat de indeling op positie 5 en 6 van de Key. Deze kan met de DAX functie Mid geïsoleerd worden. We tikken de functie in (in dit geval Mid()) en klikken op de kolom Key, waar de functie op moet worden toegepast. PowerPivot zet vervolgens de naam van de kolom in de functie. Dat is Perioden[Key]. De functie wordt afgemaakt en PowerPivot past anders dan in Excel de functie toe op alle rijen van de kolom.

CBS |Excel en open data services van StatLine 30

Nu is de indeling vanuit de key geïsoleerd in een aparte tabel. Tenslotte worden de kolommen hernoemd naar duidelijke namen. De nieuwe kolom heeft de titel CalculatedColumn1 gekregen. Dit wordt aangepast naar PeriodeIndeling. Omdat iedere dimensie een Title kolom heeft kan dat verwarrend worden later wanneer een grafiek wordt gemaakt en alles Title heet. Daarom wordt de Title kolom aangepast naar PeriodeTitle.

 De kolomnaam kan worden aangepast door rechts op de kolomnaam te klikken en de optie : Kolomnaam wijzigen uit het menu te selecteren wat geopend wordt.

Hierboven is het resultaat na wijziging van de kolomnamen. Hetzelfde is ook gedaan voor de RegioIndeling zodat snel op de regioindeling geselecteerd kan worden. In dit voorbeeld is de left-functie gebruikt.

CBS |Excel en open data services van StatLine 31

Bijlage 2: Verschil tussen Typed en Untyped Dataset

In de BulkService wordt zowel een Typed als een Untyped Dataset aangeboden. De Untyped Dataset bevat de oorspronkelijke data. De oorspronkelijke data bevat statistische detailinformatie die in de Untyped Dataset is verwijderd om het gebruik van de data in een grafiek niet te verstoren.

De statistische detailinformatie die in de meetwaarde van de UntypedDataset staat wordt ook speciale waarde genoemd en komt voor bij: Een missende meetwaarde, geheime meetwaarden en voorlopige meetwaarden. Hieronder is een overzicht en verklaring van de ‘speciale’ symbolen die kunnen voorkomen in de meetwaarden van de UntypedDataset en de waarde in de Typed Dataset.

Symbool Betekenis Typed dataset Niets (blanco) het cijfer kan op logische gronden niet voorkomen blank . Het cijfer is onbekend, onvoldoende betrouwbaar of geheim blank

In tabellen die na 2016 niet meer vernieuwd zijn, wordt nog een gedetailleerdere conventie voor symbolen gebruikt. Geheime gegevens worden apart aangegeven en wanneer een cijfer precies 0 is (niet afgerond, maar echt 0) wordt dit met een streepje aangegeven.

Symbool Betekenis Typed dataset x Het cijfer is geheim blank

nihil
0

Nihil moet omgezet worden naar 0 voordat de data gebruikt wordt.

CBS |Excel en open data services van StatLine 32

Bijlage 3: Hoe omgegaan wordt met voorlopige cijfers

Het kan voorkomen dat een publicatie cijfers bevat die nog niet definitief zijn en waar nog correcties op komen. Dan staat in de Status kolom van een tijd-dimensie (meestal Perioden) welke cijfers definitief zijn en welke niet. De Status kent drie verschillende waardes:  Voorlopig. De cijfers over deze periode zijn voorlopig en kunnen nog herzien worden.  Nader voorlopig. De cijfers over deze periode zijn herzien maar nog niet definitief.  Definitief. De cijfers over deze periode zijn definitief vastgesteld.

Subset van geretouneerde Perioden bij tabel ‘Inkomens- en vermogensrekeningen; sectorgegevens, 1988-2011’ met identifier 37723nr geven de volgende statussen:

Als van een tabel met een tijd-dimensie (TimeDimension) in de DataProperties de property ReleasePolicy op Waar staat, is het onderscheid tussen de statussen ‘Voorlopig’, ‘NaderVoorlopig’ en ‘Definitief’ toegestaan. In alle ander tabellen met een tijd-dimensie staat de status op ‘Definitief’.

CBS |Excel en open data services van StatLine 33

Bijlage 4: Coderingen Het CBS gebruikt de volgende geografische codes:

Code Start jaar Einde jaar Naam AM 2015

Arbeidsmarktregio AR 2015

Arrondissement BR 2008 Brandweerregio CP 2005 COROP-plusgebied CR 1989 COROP-gebied CS 2000 COROP-subgebied EG 1989 2008 Economisch Geografische Gebieden GA 2000 2015 Grootstedelijke agglomeratie GG 2006

GGD-regio GM 1989 Gemeente JZ 2015

Jeugdzorgregio KD 2005 2005 Kiesdistricten KK 2013

Kamer van Koophandel regio KM 1995 2004 Kieskring Tweede Kamer LB 1995 Landbouwgebied LD 1989 Landsdeel LG 1995 Groep van landbouwgebieden NO 1995 2005 Nodale gebieden PD 2013

Politiedistricten PO 1995 2012 Politieregio PV 1989 Provincie RB 1995 2001 RBA-gebied (Rayon Bureau Arbeidsvoorziening) RP 2002 2016 RPA-gebied SG 2000 2015 Stadsgewest TR 1995 Toeristengebied VR 2014

Veiligheidsregio ZK 2009

Zorgkantoorregio

Coderingen in de tijddimensie De meetwaarden zijn op maand, kwartaal –en jaarniveau aanwezig. Dit kan gebruikt worden om downdrillen van jaar naar kwartaal naar maand mogelijk te maken. Hier is sprake van een gestapelde dimensie.Voor alle tabellen geldt dat de volgende mogelijke tijdseenheden voor kunnen komen:

  1. De code van de tijddimensie bestaat uit exact 8 posities.
  2. De eerste 4 posities zijn numeriek en lopen van 1750 t/m 2099.
  3. De posities 5 t/m 8 voldoen aan de waarden aangegeven in onderstaande tabel.

CBS |Excel en open data services van StatLine 34

positie 5 en 6 Indeling Betekenis Waarden 5/6 Waarden 7/8 Numeriek Dagen Maand/dag 01 - 12 01 -31 JJ Jaar

JJ 00 MM Maanden

MM 01 - 12 KW Kwartalen

KW 01 - 04 SJ School-, Bouw- en Oogstjaar

SJ 00 HJ Half jaar

HJ 01 – 02 W1 Week, systeem 1

W1 01 t/m 53 W4 Week, vier weken

W4 01 t/m 16 VS Voortschrijdende maanden

VS 02 t/m 12 G2 2-jaarsgemiddelde

G2 00 G3 3-jaarsgemiddelde

G3 00 G4 4-jaarsgemiddelde

G4 00 G5 5-jaarsgemiddelde

G5 00 X Geen officiële periode indeling Alleen positie 5 Positie 5 heeft een X, positie 6,7,8 zijn willekeurig VJ Voortschrijdend jaar

VJ 01 – 12 M3 3 maandelijks gemiddelde

M3 01 - 12

Page 3 of 3