Typologie des ménages (STATPOP)

| Dernière mise à jour: 05.10.2023

Bild – experimental statistics

Situation initiale

La variable «type de ménage» est disponible dans le relevé structurel (RS), une enquête annuelle réalisée sur un échantillon d’environ 300 000 personnes. Les résultats du relevé structurel permettent d’obtenir des estimations directes et fiables uniquement pour des niveaux géographiques d’au moins 15 000 personnes. Ce nombre passe à environ 3000 personnes avec les données du relevé structurel regroupées sur 5 ans (pooling). Les résultats de la typologie des ménages ne sont donc pas disponibles de façon exhaustive.
 

Objectifs

Le but de ce projet est d’obtenir une variable «type de ménage» pour l’ensemble des ménages privés de la population résidante permanente au domicile principal. Cela permet de disposer:

  • Des types de ménages exhaustifs au niveau individuel comme variable d’analyse dans d’autres domaines (p.ex. appariement avec d’autres données pour comparer les revenus de travail par type de ménage).
  • Des résultats sur les types de ménage à un niveau géographique fin (p.ex. pour avoir la répartition des types de ménage par commune).

Démarche adoptée

Comme dans le relevé structurel, le type de ménage dans la statistique de la population et des ménages (STATPOP) est calculé sur la base de l’ensemble des relations entre les différents membres d’un ménage. Les sources de données sont:

  • STATPOP: l’effectif contient notamment des relations issues du Registre informatisé de l’état-civil (Infostar) pour les personnes ayant eu un événement d’état civil (mariage, naissance, …) depuis la fin des années 90, ainsi que des relations issues du système d’information du Département fédéral des affaires étrangères pour les diplomates et les fonctionnaires internationaux (Ordipro);
  • Relevé structurel: une table des relations est créée sur la base des informations transmises par les répondants lors des enquêtes des années précédentes.

En plus de ces deux sources, des algorithmes déterministes ont été utilisés pour identifier un certain nombre de relations supplémentaires (p.ex. deux personnes de sexe différent, mariées avec la même date de mariage, vivant dans le même ménage, seront définies comme époux-épouse). Ces procédures ont ainsi permis d’attribuer un type de ménage à 86% des ménages.

Différentes approches ont été testées pour l’imputation des relations manquantes ou des types de ménages manquants des 14% de ménages restants: machine learning (random forest), algorithmes déterministes développé par l’Office statistique du canton de Vaud, arbre de décision et régression multinomiale. Des études de performance et des estimations de la qualité ont été menées et ont identifié l’arbre de décision comme étant la meilleure approche dans ce contexte.
 

Résultats

Deux versions de la variable «type de ménage» ont été créées pour les ménages STATPOP de 2015 à 2022, l'une avec une limite d'âge des enfants de 18 ans et l'autre de 25 ans.

Limitations des données

Comme les variables du type de ménage STATPOP sont en partie imputées, elles conviennent comme variables d’analyse, mais ne sont pas forcément fiables au niveau individuel pour les ménages imputés. Ces variables étant encore expérimentales, il convient de le mentionner dans les publications basées sur cette information.
 

Perspectives

L’OFS poursuit les tests pour améliorer la qualité des imputations et de l’estimation de l’erreur. Outre l’approche de l’arbre de décision, des améliorations restent possibles avec l’algorithme du random forest. Le but est de minimiser les différences entre les résultats des deux «meilleures» approches afin de consolider les résultats obtenus. À moyen terme, il est envisagé d’intégrer la variable «type de ménage» dans la production standard de STATPOP.

 

Documentation


Renseignements, commande de données et feedback

Contact: info.dem@bfs.admin.ch
Téléphone: +41 58 463 67 11

Cette mise à disposition sous forme de statistique expérimentale sert également à vérifier la qualité des résultats et à identifier d'éventuels problèmes. Les retours sont donc les bienvenus.