Innovation en science des données

Projets pilotes dans le cadre de la stratégie d’innovation sur les données de l’OFS.

Ce document est la première réponse apportée par l’OFS à la thématique plus large de la numérisation. Elle se concentre plus spécifiquement sur l'application de méthodes d'analyse complémentaires (p.ex. l'analyse prédictive par des techniques statistiques avancées, la science des données et/ou l'apprentissage automatique) qui permettent d’augmenter ou de compléter la production statistique publique actuelle. Dans le cadre de la mise en œuvre de cette stratégie, cinq projets pilotes ont été retenus et sont actuellement en cours de réalisation. Leur description respective figure ci-dessous.



Image symbole - Arealstatistik Deep Learning (ADELE)

Arealstatistik Deep Learning (ADELE)

La statistique de la superficie du sol de l’OFS constitue un outil indispensable de l’observation à long terme du territoire. Il s'agit dans ce projet d'apprendre et de maîtriser les technologies de l'Intelligence Artificielle (IA), afin d'automatiser à terme (même partiellement) l’interprétation visuelle des images aériennes pour la détection et la classification des changements.

Image symbole - Automatisation du codage NOGA - NOGAuto

Automatisation du codage NOGA (NOGAuto)

Automatisation du codage de l'activité économique des entreprises à l’aide des méthodes du Machine Learning appliquées à des données déjà à disposition au sein de l'OFS (données d’enquêtes, description au Registre du commerce, mots-clés, notes explicatives des nomenclatures etc.) pour le soutien à la codification.

Image symbole - Machine Learning SoSi (ML_SoSi)

Machine Learning SoSi (ML_SoSi)

Identifier, dans une optique prospective, des parcours types dans le système de sécurité sociale et dans la vie professionnelle; grouper les bénéficiaires de prestations en fonction de leurs parcours et estimer la probabilité d'appartenance à un groupe donné par l'utilisation de variables individuelles de données rétrospectives et par l'application d'une procédure de machine learning.

Image symbole - Contrôles de plausibilité par des techniques du machine learning

Contrôles de plausibilité par des techniques du machine learning

Ce projet vise à développer et à rendre plus rapides les contrôles de plausibilité à l'OFS par l'utilisation d'algorithmes de machine learning; il vise par là même à améliorer la qualité des données.

Image symbole - Évaluer le potentiel des méthodes «estimation sur petits domaines» dans cadre de la Statistique de l’emploi (BESTA)

Évaluer le potentiel des méthodes «estimation sur petits domaines» dans cadre de la Statistique de l’emploi (BESTA)

Une équipe de projet d'une quinzaine de personnes évalue le potentiel des méthodes «d'estimation sur petits domaines» pour la Statistique de l'emploi. L'objectif est de produire des estimations fiables du total de l'emploi et des EPT pour les cantons, les grandes villes et à des niveaux de la NOGA non prévus dans le plan d'échantillonnage.