Fusion des données de recensement par région et des données d’enquête dans les Centres de Données de Recherche de Statistique Canada
Auteurs: Denis Gonthier, Tina Hotton, Cindy Cook, et Russell Wilkins
Aperçu
Résumé (français)
Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d’enquête ou à des données administratives. Nous citons des exemples d’ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs. Par quatre exemples, nous illustrons des situations où se trouvent fréquemment les chercheurs: (1) cas où les données d’enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques qui se situent au même niveau et sont codés pour la même année de référence du découpage géographique aux fins du recensement; (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement; (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes; (4) cas où les données d’enquête n’ont pas d’identificateurs géographiques, ceux ci devant d’abord être produits à partir des codes postaux du fichier d’enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s’appliquent à d’autres langages de programmation ou progiciels statistiques.
Résumé (anglais)
This article explains how to append census area-level summary data to survey or administrative data. It uses examples from datasets present in Statistics Canada Research Data Centres, but the methods also apply to external datasets. Four examples illustrate common situations faced by researchers: (1) when the survey (or administrative) and census data both contain the same level of geographic identifiers, coded to the same year standard (“vintage”) of census geography; (2) when the two files contain geographic identifiers of the same vintage, but at different levels of census geography; (3) when the two files contain data coded to different vintages of census geography; (4) when the survey data are lacking in geographic identifiers, and those identifiers must first be generated from postal codes present on the file. The examples are shown using SAS syntax, but the principles apply to other programming languages or statistical packages.
Détails
Type | Rapport à un groupe politique |
---|---|
Auteur | Denis Gonthier, Tina Hotton, Cindy Cook, et Russell Wilkins |
Année de pulication | 2006 |
Titre | Fusion des données de recensement par région et des données d’enquête dans les Centres de Données de Recherche de Statistique Canada |
Volume | 3 |
Nom du Journal | Le Bulletin technique et d'information des Centres de Données de Recherche |
Numéro | 1 |
Pages | 21-39 |
Langue de publication | Français |
- Denis Gonthier
- Denis Gonthier, Tina Hotton, Cindy Cook, et Russell Wilkins
- Fusion des données de recensement par région et des données d’enquête dans les Centres de Données de Recherche de Statistique Canada
- 2006
- 1