Évaluer le potentiel des méthodes «estimation sur petits domaines» dans cadre de la Statistique de l’emploi (BESTA)

| Dernière mise à jour: 28.06.2024

image - experimental statistics

Objectifs

Pour des raisons de précision, la Statistique de l’emploi (STATEM ou BESTA en allemand) ne propose plus de résultats cantonaux depuis la révision de l’année 2000, hormis pour les cantons ou les villes qui financent des augmentations de la taille d’échantillon les concernant. Pour remédier à cette situation, la possibilité de produire des estimations cantonales du niveau absolu de l’emploi à l’aide de méthodes de type «small area estimation» (SAE) a été testée dans le cadre d’un projet pilote de la stratégie d’innovation des données de l’OFS. Un objectif complémentaire du projet était d’étendre ces investigations aux branches économiques de la Nomenclature Générale de l’Activité (NOGA) du niveau 2 (NOGA2).
 

Méthode

La méthode SAE utilisée repose sur une modélisation de la variable relevée dans l’enquête, ici l’emploi, en fonction de variables auxiliaires qui doivent être connues pour toutes les unités de la population. Les variables auxiliaires disponibles dans ce contexte sont par exemple la grande région, la section d’activité économique, ou encore l’emploi selon le cadre de tirage de l’OFS basé sur le Registre des Entreprises et des Établissements. L’emploi selon le cadre de tirage peut différer de l’emploi relevé lors de l’enquête, en particulier du fait d’effets de mesure, ainsi que de décalages temporels entre les informations relevées.

Le modèle utilisé dans ce projet est un modèle linéaire mixte avec effet aléatoire pour le canton et la NOGA2. La modélisation est réalisée pour 20 échantillons trimestriels, du 2ème trimestre 2015 au 4ème trimestre 2019.

Évaluation

La précision des estimations est évaluée en termes de biais et de variance sous le plan, c’est-à-dire sous une optique «design-based». Comme les estimations SAE reposent sur une modélisation, elles comportent un risque de biais lié aux éventuels défauts du modèle. En revanche, elles permettent en général une diminution de la variance par rapport aux estimations directes traditionnelles. La validation et l’évaluation du risque de biais des estimations SAE jouent donc un rôle primordial et sont basées ici sur les principes suivants. Pour les domaines disposant d’une taille d’échantillon suffisamment grande, les estimations SAE sont comparées aux estimations directes, qui ont alors une précision jugée satisfaisante (absence de biais et faible variance). Pour les plus petits domaines pour lesquels la précision de l’estimation directe n’est pas jugée satisfaisante, les estimations SAE sont comparées à des approximations des valeurs cibles, appelées CAS2 dans le cadre de ce projet, et construites sur la base de la Statistique structurelle des entreprises (STATENT) et du cadre de la BESTA. Les estimations SAE sont comparées prioritairement aux estimations directes du fait des différences existant entre l’univers de la BESTA et celui de la STATENT. De plus, les valeurs du CAS2 ne sont disponibles, comme la STATENT, que pour les 4èmes trimestres de chaque année. La variance est quant à elle estimée à l’aide d’une méthode basée sur un bootstrap.
 

Résultats

La grande majorité des résultats cantonaux est considérée comme validée. Les autres cas concernent généralement l’emploi des femmes dans certains (petits) cantons de la Suisse orientale ou de la Suisse centrale, mais les écarts entre l’estimation SAE et le seuil de validation sont souvent relativement faibles. L’estimation de l’emploi des femmes dans le canton du Tessin, pour les échantillons du 2ème trimestre 2015 au 4ème trimestre 2017, est le cas le plus problématique. Les résultats sont néanmoins globalement très encourageants, et des améliorations sont potentiellement encore possibles.

De façon générale, les SAE permettent un gain de variance très important, hormis pour les très grands cantons tels que Zürich pour lequel le gain est plus faible mais l’objectif de précision est déjà atteint avec l’estimation directe. Le gain de précision est plus marqué pour les petits cantons. A titre d’exemple, pour le canton d’Appenzell Rhodes-Intérieures, les coefficients de variation des estimations SAE se situent généralement entre 2% et 4% pour l’emploi total des hommes et des femmes confondus, tandis que ceux de l’estimateur direct peuvent dépasser les 10% selon les années.

Il convient néanmoins de souligner que ces résultats très encourageants ont été obtenus sur la base d’échantillons pour lesquels des cantons ou des villes ont financé des augmentations d’échantillon. Il n’a pas été possible dans le cadre de ce projet d’évaluer objectivement s’il serait envisageable à l’avenir de renoncer à ces augmentations. Par ailleurs, ce projet ne porte que sur l’emploi total. Les augmentations d’échantillons offrent également des estimations plus précises de la répartition par taux d’occupation, des équivalents plein temps, des places vacantes, ainsi que pour des variables qualitatives.

En ce qui concerne les estimations SAE au niveau des NOGA2, les analyses effectuées montrent des résultats plus contrastés que pour les cantons, mais néanmoins encourageants. Ils ne permettent cependant pas, dans l’état actuel du projet, la diffusion de séries pour les branches économiques aux niveaux envisagés.

Conclusions

Les résultats obtenus jusqu’à présent permettent la diffusion sous la forme de statistiques expérimentales d’estimations SAE pour le total de l’emploi, et l’emploi ventilé par sexe, au niveau cantonal, mais pas au niveau des NOGA2. Ces estimations SAE se basent sur les échantillons trimestriels de la BESTA avec l’augmentation de la taille de l’échantillon financée par des cantons et des villes. Il n’a pas été faisable dans le cadre de ce projet d’évaluer la possibilité de renoncer à ces augmentations. En effet, il faudrait pour cela disposer de deux sets de données, l’un avec et l’autre sans augmentation d’échantillon. Cet essai pourrait être réalisé dès que suffisamment de données seront disponibles avec cette séparation de l’échantillon.

 

Documentation