Merging area-level census data with survey data in Statistics Canada Research Data Centres
Authors: Denis Gonthier, Tina Hotton, Cindy Cook, and Russell Wilkins
Overview
Abstract (English)
This article explains how to append census area-level summary data to survey or administrative data. It uses examples from datasets present in Statistics Canada Research Data Centres, but the methods also apply to external datasets. Four examples illustrate common situations faced by researchers: (1) when the survey (or administrative) and census data both contain the same level of geographic identifiers, coded to the same year standard (“vintage”) of census geography; (2) when the two files contain geographic identifiers of the same vintage, but at different levels of census geography; (3) when the two files contain data coded to different vintages of census geography; (4) when the survey data are lacking in geographic identifiers, and those identifiers must first be generated from postal codes present on the file. The examples are shown using SAS syntax, but the principles apply to other programming languages or statistical packages.
Abstract (French)
Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d’enquête ou à des données administratives. Nous citons des exemples d’ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs. Par quatre exemples, nous illustrons des situations où se trouvent fréquemment les chercheurs: (1) cas où les données d’enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques qui se situent au même niveau et sont codés pour la même année de référence du découpage géographique aux fins du recensement; (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement; (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes; (4) cas où les données d’enquête n’ont pas d’identificateurs géographiques, ceux ci devant d’abord être produits à partir des codes postaux du fichier d’enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s’appliquent à d’autres langages de programmation ou progiciels statistiques.
Details
Type | Report to policy group |
---|---|
Author | Denis Gonthier, Tina Hotton, Cindy Cook, and Russell Wilkins |
Publication Year | 2006 |
Title | Merging area-level census data with survey data in Statistics Canada Research Data Centres |
Volume | 3 |
Journal Name | The Research Data Centres Information and Technical Bulletin |
Number | 1 |
Pages | 21-39 |
Institution | Statistics Canada |
Publication Language | English |
- Denis Gonthier
- Denis Gonthier, Tina Hotton, Cindy Cook, and Russell Wilkins
- Merging area-level census data with survey data in Statistics Canada Research Data Centres
- 2006
- Statistics Canada
- 1