Ce document est la première réponse apportée par l’OFS à la thématique plus large de la numérisation. Elle se concentre plus spécifiquement sur l'application de méthodes d'analyse complémentaires (p.ex. l'analyse prédictive par des techniques statistiques avancées, la science des données et/ou l'apprentissage automatique) qui permettent d’augmenter ou de compléter la production statistique publique actuelle. Dans le cadre de la mise en œuvre de cette stratégie, cinq projets pilotes ont été retenus et sont actuellement en cours de réalisation. Leur description respective figure ci-dessous.
La statistique de la superficie du sol de l’OFS constitue un outil indispensable de l’observation à long terme du territoire. Il s'agit dans ce projet d'apprendre et de maîtriser les technologies de l'Intelligence Artificielle (IA), afin d'automatiser à terme (même partiellement) l’interprétation visuelle des images aériennes pour la détection et la classification des changements.
Automatisation du codage de l'activité économique des entreprises à l’aide des méthodes du Machine Learning appliquées à des données déjà à disposition au sein de l'OFS (données d’enquêtes, description au Registre du commerce, mots-clés, notes explicatives des nomenclatures etc.) pour le soutien à la codification.
Identifier, dans une optique prospective, des parcours types dans le système de sécurité sociale et dans la vie professionnelle; grouper les bénéficiaires de prestations en fonction de leurs parcours et estimer la probabilité d'appartenance à un groupe donné par l'utilisation de variables individuelles de données rétrospectives et par l'application d'une procédure de machine learning.
Ce projet vise à développer et à rendre plus rapides les contrôles de plausibilité à l'OFS par l'utilisation d'algorithmes de machine learning; il vise par là même à améliorer la qualité des données.
Une équipe de projet d'une quinzaine de personnes évalue le potentiel des méthodes «d'estimation sur petits domaines» pour la Statistique de l'emploi. L'objectif est de produire des estimations fiables du total de l'emploi et des EPT pour les cantons, les grandes villes et à des niveaux de la NOGA non prévus dans le plan d'échantillonnage.