Passer à la navigation du site Passer au contenu principal

À propos du Centre de données de recherche virtuel (CDRv)

À propos du CDRv

Le Réseau canadien des Centres de données de recherche (RCCDR) et Statistique Canada ont collaboré avec nos partenaires universitaires à travers le Réseau ainsi qu’avec notre institution hôte, l’Université McMaster, pour développer le Centre de données de recherche virtuel (CDRv) – une nouvelle plateforme TI en réseau qui offrira aux chercheuses et chercheurs canadiens de nouvelles options améliorées pour accéder aux microdonnées de Statistique Canada.

Cette plateforme virtuelle modernise l’infrastructure informatique qui soutient plus de 2 500 membres de la communauté de recherche du RCCDR à travers le pays, en améliorant les capacités de stockage, de calcul et de réseau. Cette mise à niveau optimisera l’efficacité technique du réseau et fournira des capacités informatiques avancées pour faciliter l’analyse et la manipulation de grands ensembles de données.

Plus important encore, cette nouvelle plateforme informatique en réseau permettra aux chercheuses et chercheurs approuvés, issus d’institutions agréées ayant des projets de recherche admissibles, d’accéder virtuellement aux microdonnées à partir d’espaces de travail autorisés (ex. : bureau ou domicile). Près de 80 % des fichiers de microdonnées répondent aux critères d’accès à distance. L’arrivée du CDRv permettra également d’étendre les heures d’ouverture des Centres de données de recherche (CDR), offrant ainsi une plus grande flexibilité aux membres de la communauté de recherche travaillant sur leurs projets dans les CDR.

Le Réseau canadien des Centres de données de recherche (RCCDR) et Statistique Canada ont collaboré avec les universités actuellement membres du Réseau ainsi qu’avec notre institution hôte, l’Université McMaster, pour développer le CDRv. 

Le répertoire de données de Statistique Canada comprend des données denquête, de recensement, données administratives et couplées, et continue de s’enrichir, grâce en partie à un solide partenariat avec le RCCDR et les institutions collaboratrices qui facilitent l’accessibilité de ces données pour la recherche. Actuellement, plus de 200 ensembles de données sont disponibles pour la recherche à travers les CDR. 

L’accès aux microdonnées confidentielles de Statistique Canada est restreint aux personnes ayant des projets de recherche approuvés. Les propositions de projet doivent être soumises pour approbation via le Portail d’accès aux microdonnées (PAM) de Statistique Canada. 

Voir ci-dessous pour savoir comment accéder aux microdonnées. 

Les personnes menant des recherches et dont les projets sont admissibles à l’accès à distance à la plateforme informatique virtuelle en réseau pourront accéder à leurs projets à partir de leur ordinateur personnel dans un espace de travail autorisé, en utilisant un processus d’authentification sécurisé.

Les projets non admissibles à l’accès à distance devront continuer à être effectués dans un CDR physique. L’admissibilité des projets à l’accès à distance est déterminée par le niveau de sensibilité des données concernées. La sensibilité des données est évaluée en fonction du risque de divulgation et du caractère sensible du contenu du fichier de données. Environ 20 % des données détenues par Statistique Canada sont considérées de nature délicate et seront exclues de l’accès à distance.

Veuillez consulter régulièrement ce site pour suivre les annonces sur le déploiement du CDRv dans les institutions.

L’image ci-dessous présente le calendrier de déploiement de la plateforme informatique en réseau du centre de données de recherche virtuel (CDRv).

Le personnel des premières institutions collaboratrices a déjà tenu ses réunions de lancement. 

À la suite de ces réunions, un courriel contenant une invitation à suivre les premières étapes du déploiement est envoyé aux personnes menant des recherches. Un tableau de bord CDRv, protégé par mot de passe et accessible via le lien ci-dessous, est ensuite mis à la disposition des chercheuses et chercheurs affiliés aux institutions collaboratrices lorsque la date prévue pour leur déploiement se rapproche. 

Pour toute question générale, ces pages Web publiques, dédiées au CDRv, sont votre principale ressource. 

Le terme « virtuel » fait référence à la nouvelle infrastructure informatique qui a été mise en place pour le réseau. 

Les comptes et projets de toutes les personnes menant des recherches, quel que soit leur lieu d’accès, seront hébergés sur cette plateforme virtuelle. 

Le terme « à distance » se réfère spécifiquement au lieu d’accès, c’est-à-dire en dehors d’un CDR. Les projets admissibles peuvent être consultés depuis un autre espace de travail autorisé, comme un domicile ou un bureau, à partir d’un appareil personnel. 

Après le déploiement du CDRv, ceux et celles qui mènent des recherches pourront accéder à leur projet depuis un ou plusieurs des emplacements suivants: 

  1. Locaux de Statistique Canada : Un Centre de données de recherche (CDR) fonctionnant avec la présence du personnel de Statistique Canada. 
  2. Salle sécurisée : Un CDR fonctionnant sans la présence du personnel de Statistique Canada. 
  3. Espace de travail autorisé : Accès à distance depuis un lieu approuvé (comme un bureau fermé, une salle de classe fermée, une salle de conférence, ou un espace privé au domicile de la personne menant la recherche).

Le lieu d’accès est déterminé en fonction d’une combinaison de (1) la sensibilité des données et (2) l’accréditation de la personne menant la recherche. 

  1. Sensibilité des données 

Les données de Statistique Canada sont évaluées en fonction du risque de divulgation et de la nature délicate du contenu du fichier de données. Les spécialistes de Statistique Canada attribuent une note à chaque fichier à l’aide d’un outil de classification de la confidentialité (Confidentiality Classification Tool – CCT), avec des scores allant de 0 à 9. 

2. Accréditation de la personne menant la recherche 

Accréditation de niveau 1 : Toutes les personnes menant des recherches seront admissibles à une accréditation de niveau 1. 

Accréditation de niveau 2 : Les personnes affiliées à un partenaire qui est une institution collaboratrice du RCCDR seront admissibles à une accréditation de niveau 2.

Note : Une violation des protocoles de sécurité des CDR ou du CDRv pourrait entraîner la perte de l’accréditation de la personne menant la recherche, voire celle de l’institution associée à cette personne, en fonction de la gravité de l’infraction. 

Facteurs déterminants Lieux d’accès
Chercheuses et chercheurs
Niveau d’accréditation
Sensibilité des données (CCT Score) Espace de travail autorisé (Accès à distance) Salle sécurisée (CDR sans personnel) Locaux de StatCan (CDR avec personnel)
Niveau 1 CCT= 0-9 x
Niveau 2 CCT <=7   x x x
CCT = 8 x x
CCT = 9 x

Le répertoire de données contiendra la version la plus récente des données, avec une convention de nommage standardisée. Dans la plupart des cas, il s’agira des mêmes données que celles utilisées dans l’ancien système informatique. Une formation sera offerte aux personnes menant des recherches pour les aider à adapter leur syntaxe à la nouvelle localisation du répertoire et au chemin d’accès des fichiers. 

Si vous avez créé vos propres versions de travail des données dans votre dossier de projet, celles-ci seront migrées dans le CDRv dans le même format. 

Liste des logiciels : 

La dernière version des logiciels couramment utilisés sera mise à votre disposition via le CDRv (exemples : SPSS, SAS, Stata et R), ainsi que les dépôts de modules et de « packages » associés. 

Une liste complète des logiciels standards disponibles sur la plateforme informatique du CDRv est accessible ici :   

  • ArcGIS 
  • LaTeX 
  • MATLAB(ML) 
  • MLwiN 
  • Mplus 
  • Octave  
  • PSPP 
  • R 
  • Rstudio 
  • SAS 
  • SPSS 
  • StatTransfer 
  • Stata 

Requête pour l’obtention de nouveaux logiciels et modules : 

Lors du déploiement, des instructions seront fournies aux chercheuses et chercheurs pour les demandes d’installation de nouveaux logiciels ou de logiciels additionnels. Les demandes seront examinées au cas par cas. 

Si vous utilisez un logiciel qui ne figure pas dans la liste standard des logiciels pour votre projet actuel, il est recommandé de terminer votre projet dès que possible afin d’éviter d’éventuels retards liés aux demandes de logiciels. 

Calendrier de déploiement et accès

Les CDR seront migrés vers la plateforme informatique du CDRv selon un déploiement progressif à partir de 2025, avec une finalisation prévue au début de 2026. 

Les personnes menant des recherches seront contactées à l’avance par le RCCDR et Statistique Canada avant la transition de leur CDR vers la plateforme du CDRv. 

Pendant le déploiement, tous les projets seront transférés du serveur local du CDR vers la nouvelle plateforme informatique en réseau du CDRv. 

Les chercheuses et chercheurs concernés recevront un courriel dans la semaine précédant le lancement du déploiement de leur CDR. Un lien vers un tableau de bord (lien ci-dessous) leur sera fourni avec les dates exactes. 

Toutes les personnes menant des recherches peuvent consulter le calendrier 

Cliquez ici pour voir le calendrier de déploiement. 

Phase 1 – Lancement, orientations et acquisition d’équipement

Durée : 7 semaines
CDR Statut opérationnel : OUVERT

Phase 2 – Connectivité réseau et transfert des données

Durée : 2 semaines
CDR Statut opérationnel : OUVERT

Phase 3 – Configuration des postes de travail et des dossiers

Durée : 1 semaine
CDR État opérationnel : FERMÉ

 

Phase 4 – Intégration et formation

Durée : 1 semaine
CDR Statut opérationnel : OUVERT
CDRv Statut opérationnel : ACTIF

Phase 5 – Démantèlement et finalisation

Durée : 1 semaine ou +
Statut opérationnel du CDR : OUVERT
Statut opérationnel du CDRv : ACTIF

Les Centres de données de recherche (CDR) seront temporairement fermés pendant la migration. L’interruption prévue est d’environ une semaine, le temps de transférer les données et d’intégrer les personnes menant des recherches à la nouvelle plateforme informatique.

Une fois le déploiement de votre CDR commencé, vous aurez accès à un tableau de bord dédié (voir le lien ci-dessous) contenant les dates exactes de fermeture.

Toutes les autres personnes menant des recherches peuvent consulter le calendrier de déploiement pour voir l’ensemble du plan de transition.

Toutes les personnes menant des recherches, y compris celles ayant un accès à distance, seront les bienvenues pour travailler sur leurs projets dans les CDR afin de bénéficier du soutien du personnel des CDR ou d’assister à des formations. 

Les chercheuses et chercheurs dont les projets ne sont pas admissibles à l’accès à distance (par exemple, ceux ayant un score CCT de 8 ou 9, ou ceux provenant de partenaires qui ne sont pas des institutions collaboratrices), ne pourront se connecter à la plateforme informatique du CDRv que depuis un CDR. 

Non, les gens menant des recherches ne pourront plus accéder aux anciens serveurs une fois leurs projets migrés vers la plateforme informatique du CDRv.

L’ancienne infrastructure informatique des CDR, appelée système hérité, sera démantelée. Après cette transition, vous accéderez à votre projet exclusivement via la nouvelle plateforme informatique du CDRv, soit dans un CDR physique, soit à distance depuis un espace de travail autorisé.

Projets

Tous les projets actifs seront transférés vers la plateforme informatique du CDRv lors du déploiement, car l’ancienne infrastructure, appelée système hérité, ne sera plus accessible une fois la migration d’un CDR effectuée. 

Ceux et celles dont le projet est sur le point d’être terminé sont encouragés à le finaliser avant la transition. Cependant, tous les projets en cours seront migrés et resteront accessibles sur le nouveau réseau du CDRv. Les projets archivés seront également transférés vers la plateforme informatique du CDRv pour y être conservés jusqu’à l’expiration de leur période de rétention. 

Un logiciel sera utilisé lors de la migration afin de vérifier l’intégrité des fichiers transférés des serveurs locaux vers la plateforme informatique du CDRv. Ce logiciel utilisera des sommes de contrôle (checksums) pour s’assurer que les fichiers ne sont pas corrompus pendant le transfert. 

Cependant, ce logiciel ne peut pas garantir l’absence de problèmes préexistants dans les fichiers. Il est donc recommandé à chaque personne menant des recherches de vérifier le contenu de ses dossiers de projet avant et après la migration afin de s’assurer de leur intégrité. 

Le déploiement complet pour chaque CDR s’étalera sur douze semaines. La phase de migration des données durera 2 à 3 semaines. Toutefois, chaque CDR ne sera fermé que pendant la dernière semaine de cette phase, afin d’assurer l’intégrité du transfert des données vers la nouvelle plateforme du CDRv. 

Les projets seront accessibles une fois la migration des données terminée, après que toutes les personnes menant des recherches auront été intégrées, formées aux procédures de connexion au CDRv et auront reçu leurs nouvelles informations d’identification. 

Oui, tout le contenu actuellement stocké dans les dossiers de projet des personnes menant des recherches sera migré vers la plateforme informatique du CDRv et restera accessible dans les dossiers de projet sur la nouvelle infrastructure.

Oui, les mêmes procédures de demande d’ajout de données externes à un projet continueront de s’appliquer.

Tout démarrage de projet et toute demande de modification sera mise en suspens, une semaine avant le début du déploiement de votre CDR et aucune modification ne sera traitée jusqu’à la fin de la transition, afin de migrer efficacement les projets et les personnes vers le CDRv. Cela inclut les ajustements visant à ajouter ou retirer des co-chercheuses et co-chercheurs et/ou des ensembles de données, les modifications de la date de fin d’un contrat, ainsi que les transferts vers ou depuis un CDR. 

Les gens menant des recherches sont invités à collaborer avec leur analyste en CDR afin d’apporter toutes les modifications nécessaires à leur projet avant le début du déploiement de leur centre. 

(Consultez le calendrier de déploiement pour connaître les dates) 

Oui, les nouveaux projets sont toujours acceptés, et les délais d’accès seront communiqués au moment de l’approbation du projet. Les dates de début des projets pourraient être affectées par le calendrier de déploiement d’un centre.

tant donné que le CDR restera ouvert pendant la plupart des phases du déploiement, les personnes menant des recherches pourront continuer à soumettre leurs demandes d’approbation comme d’habitude. 

Cependant, veuillez noter que le personnel du CDR sera très occupé par les activités liées au déploiement pendant la migration. Par conséquent, les délais d’approbation seront plus longs qu’à l’habitude. Il est donc recommandé d’anticiper et de planifier en conséquence.

Toutes les personnes menant des recherches devront disposer d’un smartphone sur lequel l’application FortiMobile pourra être installée afin de recevoir les codes d’authentification à deux facteurs nécessaires pour se connecter.

Les personnes accédant à leur projet depuis un espace de travail autorisé à l’aide d’un ordinateur personnel (PC ou portable) auront besoin d’un Mac ou PC :

  1. Mac : Apple M1 et versions ultérieures
  2. PC : Windows 10 et versions ultérieures
  3. Le système d’exploitation doit être à jour avec toutes les mises à jour et correctifs installés.

Les utilisateurs de PC devront également disposer d’un logiciel antivirus fonctionnel et à jour (ex. Windows Defender).

Une connexion Internet est requise pour accéder au CDRv, mais le Wi-Fi public ne sera pas autorisé.

Pendant l’année de transition, les projets multicentres, c’est-à-dire les projets accessibles par des personnes menant des recherches dans différents CDR, seront impactés. Les CDR seront migrés vers la plateforme informatique du CDRv selon un calendrier individuel. La plateforme informatique du CDRv et le réseau existant des CDR (système hérité) ne seront pas connectés entre eux.  

Par conséquent, le partage et la synchronisation des fichiers entre les deux systèmes ne seront pas possibles. 

Affiliations au CDR 

Les personnes menant des recherches directement affiliées au CDR en cours de migration seront intégrées à la plateforme informatique du CDRv dans le cadre du déploiement de leur centre. Une fois intégrées, elles devront travailler exclusivement depuis un centre migré, jusqu’à ce que les autres CDR soient également intégrés au CDRv. 

Affiliations institutionnelles 

Les personnes affiliées à d’autres institutions collaboratrices du RCCDR seront intégrées à la plateforme informatique du CDRv lorsque leur centre migrera et continueront d’accéder à leurs projets sur l’ancien système (système hérité) jusqu’à ce moment-là. Celles affiliées à des institutions qui n’ont pas encore migré vers la plateforme du CDRv ne pourront plus accéder à leurs projets dans les centres déjà migrés tant que leur institution ne sera pas elle aussi intégrée au CDRv. 

Les personnes n’ayant aucune affiliation avec un institution collaboratrice du RCCDR seront intégrées au CDR où elles travaillent. 

Projets multicentres 

Pour les projets multicentres impliquant à la fois des personnes intégrées au CDRv et d’autres en attente de la migration vers le CDRv : 

  • Une copie identique du dossier de projet sera créée à la fois sur la plateforme informatique du CDRv et sur l’ancien système (système hérité) lors de la phase 3 du déploiement du CDR en migration. 
  • Chaque personne pourra continuer à travailler sur le projet, mais le travail effectué sur le CDRv ne sera pas synchronisé avec celui effectué sur l’ancien système. De plus, le partage de fichiers entre les deux systèmes ne sera pas possible. 
  • Une fois que tous les CDR impliqués dans le projet auront migré vers le CDRv, les dossiers de projet seront fusionnés. Vous aurez accès aux contenus des deux copies du dossier et devrez supprimer les fichiers en double afin d’optimiser l’espace de stockage. 
  • Les équipes de projets multicentres doivent anticiper et organiser leur travail lorsque les membres ne pourront plus accéder au même dossier de projet. Par exemple, il peut être utile de diviser les objectifs de recherche ou de regrouper temporairement le travail avec des co-chercheuses ou co-chercheurs ayant accès à la même plateforme. 
  • Il est recommandé de coordonner le travail avec votre équipe afin d’éviter de travailler sur les mêmes fichiers et de bien noter toutes les modifications, afin de minimiser les conflits de fichiers et de faciliter l’identification et la suppression des doublons lors de la fusion finale des dossiers du projet. 

Si vous accédez à votre(vos) projet(s) dans plusieurs CDR et que l’un d’eux est en cours de migration vers la plateforme informatique du CDRv ,tandis que l’autre n’a pas encore migré, vous n’aurez accès à votre(vos) projet(s) que depuis un seul centre.

La plateforme informatique du CDRv et le réseau existant des CDR (système hérité) ne seront pas connectés entre eux. Cela signifie que vous ne pourrez pas partager ni synchroniser de fichiers entre un CDR migré vers la plateforme du CDRv et un CDR fonctionnant encore sur l’ancien système. 

Vous serez migré(e) vers le réseau du CDRv avec votre institution affiliée. Vous ne pourrez pas accéder à votre projet depuis un CDR ayant migré vers le CDRv avant que votre institution affiliée ne soit également migrée. Une fois la migration de votre institution effectuée, vous devrez exclusivement accéder à votre projet depuis votre institution affiliée ou un autre CDR ayant déjà basculé sur la plateforme informatique du CDRv. 

Support technique

Soutien et assistance technique :

La formation et les sessions d’orientation destinées aux personnes menant des recherches incluront des instructions sur les contacts à privilégier en fonction du type de support requis.

Un système de demande de service (SR- service request) sera disponible au sein du CDRv pour obtenir une assistance technique du RCCDR. Par ailleurs, le personnel de Statistique Canada sera disponible par courriel ou en personne dans les CDR.

La machine virtuelle de base sera un poste de travail Windows 10 avec 32 Go de RAM et quatre processeurs de 2,25 GHz, chacun ayant 4 cœurs, soit un total de 16 cœurs. En termes de performance, la machine sera approximativement équivalente à un processeur Intel i9 de 10e génération ou i7 de 11e génération pour le traitement multicœur. Chaque machine virtuelle aura 150 Go de stockage flash pour les applications et les fichiers temporaires. 

Un processus de demande sera mis en place pour permettre d’obtenir plus de RAM ou une carte graphique plus puissante si nécessaire. 

Comment se joindre au réseau

Une fois qu’une institution sera prête pour le déploiement du CDRv, Statistique Canada contactera les personnes menant des recherches afin d’examiner l’admissibilité de leur projet et/ou d’initier les prochaines étapes pour l’accès virtuel. 

Les nouveaux projets de recherche sur les microdonnées, soumis via le Portail d’accès aux microdonnées (PAM) de Statistique Canada après le lancement du CDRv, seront automatiquement évalués pour déterminer leur admissibilité à l’accès à distance ainsi qu’à l’accès en personne dans un CDR. 

Veuillez consulter notre page « Trouver un CDR » pour voir la liste des institutions partenaires et vérifier si votre institution fait partie de notre réseau, puis suivez les étapes ci-dessous.

Consultez notre page Web « Accéder aux données des CDR » pour :

Si votre institution ne fait pas actuellement partie du réseau : 

les nouveaux projets de recherche sur les microdonnées peuvent être soumis via le Portail d’accès aux microdonnées (PAM) de Statistique Canada. 

Si votre institution souhaite rejoindre le RCCDR, veuillez contacter info@crdcn.ca en indiquant « Nouvelle institution collaboratrice du RCCDR » en objet. 

Le réseau acceptera de nouveaux membres institutionnels à partir de la fin 2025 / début 2026, mais vous pouvez nous contacter dès maintenant pour en savoir plus sur les étapes d’adhésion et entamer le processus.