Statistiques expérimentales de l'OFS

Les statistiques expérimentales sont produites grâce à de nouvelles méthodes et/ou de nouvelles sources de données et sont de ce point de vue en phase aussi bien avec la stratégie d’innovation des données de l’OFS qu’avec le programme statistique pluriannuel de la Confédération. On trouve également sur ce site la description des projets (pilotes) actuellement en cours de développement.

Leur publication permet d’impliquer en amont les utilisateurs et partenaires aussi bien sur le plan de leur développement que de celui de leur consolidation.

Leur but est de répondre encore mieux et plus vite aux besoins des utilisateurs, que ce soit en termes d’efficacité, de qualité ou de rapidité. Ces statistiques disposent cependant encore d’un potentiel de maturité, notamment sur le plan de la méthodologie qui est justement encore en cours d’évaluation. Elles sont de ce fait clairement signalées et sont munies d’un logo facilement reconnaissable.

Statistiques publiées

Estimation petits domaines (communes) du taux d’activité dans le relevé structurel

Le relevé structurel de la population fournit des informations importantes sur la population et notamment sur la situation du travail. Le but de l’estimation sur petits domaines est de repousser les limites imposées par les méthodes standards. Les travaux ont permis de montrer qu’il est possible d’obtenir des estimations annuelles fiables du taux d’activité pour les communes disposant d’un échantillon d’au moins 100 personnes.

Projets pilotes dans le cadre de la stratégie d’innovation sur les données

En date du 21 novembre 2017, l’OFS a publié sa stratégie d’innovation sur les données .

Ce document est la première réponse apportée par l’OFS à la thématique plus large de la numérisation. Elle se concentre plus spécifiquement sur l'application de méthodes d'analyse complémentaires (p.ex. l'analyse prédictive par des techniques statistiques avancées, la science des données et/ou l'apprentissage automatique) qui permettent d’augmenter ou de compléter la production statistique publique actuelle. Dans le cadre de la mise en œuvre de cette stratégie, cinq projets pilotes ont été retenus et sont actuellement en cours de réalisation. Leur description respective figure ci-dessous.

Projet ”Arealstatistik Deep Learning” (ADELE)

La statistique de la superficie du sol de l’OFS constitue un outil indispensable de l’observation à long terme du territoire. Il s'agit dans ce projet d'apprendre et de maîtriser les technologies de l'Intelligence Artificielle (IA), afin d'automatiser à terme (même partiellement) l’interprétation visuelle des images aériennes pour la détection et la classification des changements.

Projet ”Automatisation du codage NOGA” (NOGAuto)

Automatisation du codage de l'activité économique des entreprises à l’aide des méthodes du Machine Learning appliquées à des données déjà à disposition au sein de l'OFS (données d’enquêtes, description au Registre du commerce, mots-clés, notes explicatives des nomenclatures etc.) pour le soutien à la codification.

Projet ”Machine Learning SoSi” (ML_SoSi)

Identifier, dans une optique prospective, des parcours types dans le système de sécurité sociale et dans la vie professionnelle; grouper les bénéficiaires de prestations en fonction de leurs parcours et estimer la probabilité d'appartenance à un groupe donné par l'utilisation de variables individuelles de données rétrospectives et par l'application d'une procédure de machine learning.

Projet ”Contrôles de plausibilité par des techniques du machine learning”

Ce projet vise à développer et à rendre plus rapides les contrôles de plausibilité à l'OFS par l'utilisation d'algorithmes de machine learning; il vise par là même à améliorer la qualité des données.

Projet ”Evaluer le potentiel des méthodes "estimation sur petits domaines" dans cadre de la Statistique de l’emploi” (BESTA)

Une équipe de projet d'une quinzaine de personnes évalue le potentiel des méthodes "d'estimation sur petits domaines" pour la Statistique de l'emploi. L'objectif est de produiredes estimations fiables du total de l'emploi et des EPT pour les cantons, les grandes villeset à des niveaux de la NOGA non prévus dans le plan d'échantillonnage.