Haushaltstypologie (STATPOP)

| Letzte Aktualisierung: 11.04.2022

Bild – experimental statistics

Ausgangslage

Die Variable «Haushaltstyp» wird in der Strukturerhebung (SE) erfasst, die jährlich mit einer Stichprobe von rund 300 000 Personen durchgeführt wird. Anhand der Ergebnisse der Strukturerhebung können direkte und zuverlässige Schätzungen nur für Raumgliederungen von mindestens 15 000 Personen vorgenommen werden. Werden die Daten der Strukturerhebung über fünf Jahre gepoolt, sind Schätzungen für Raumgliederungen von rund 3000 Personen möglich. Die Haushaltstypologie ist daher nicht vollumfänglich verfügbar.
 

Ziele

Das Ziel dieses Projekts ist es, eine Variable «Haushaltstyp» für alle Privathaushalte der ständigen Wohnbevölkerung am Hauptwohnsitz zu erhalten. Dies ermöglicht Folgendes:

  • Vollständige Haushaltstypen auf individueller Ebene, die als Analysevariable in anderen Bereichen verwendet werden können (z.B. Datenverknüpfungen für einen Vergleich der Erwerbseinkommen nach Haushaltstyp).
  • Ergebnisse zu den Haushaltstypen auf einem detaillierteren Regionalisierungsgrad (z.B. Verteilung der Haushaltstypen nach Gemeinde).

Vorgehen

Analog zur Strukturerhebung wird der Haushaltstyp in der Statistik der Bevölkerung und der Haushalte (STATPOP) auf Basis sämtlicher Beziehungen zwischen den verschiedenen Mitgliedern eines Haushalts berechnet. Die Datenquellen sind:

  • STATPOP: Der Bestand enthält die Beziehungen aus dem informatisierten Zivilstandsregister (Infostar) für die Personen mit einem Zivilstandsereignis (Heirat, Geburt usw.) seit Ende der 1990er-Jahre sowie die Beziehungen aus dem Informationssystem des Eidgenössischen Departements für auswärtige Angelegenheiten für die Diplomaten und internationalen Beamten (Ordipro).
  • Strukturerhebung: Anhand der Informationen, die von den Befragten der vorangehenden Jahre übermittelt wurden, wird eine Beziehungstabelle erstellt.

Zusätzlich zu diesen beiden Quellen wurden deterministische Algorithmen verwendet, die Aufschluss über eine bestimmte Anzahl weiterer Beziehungen geben (z.B. zwei Personen unterschiedlichen Geschlechts, die beide verheiratet sind, das gleiche Heiratsdatum aufweisen und im selben Haushalt leben, werden als Ehemann/Ehefrau definiert). Mit diesen Verfahren konnte bei 86% der Haushalte ein Haushaltstyp zugeordnet werden.

Für die Imputation der fehlenden Beziehungen oder der fehlenden Haushaltstypen der restlichen 14% der Haushalte wurden verschiedene Ansätze geprüft: Machine Learning (Random Forest), deterministische Algorithmen entwickelt vom Statistikamt des Kantons Waadt, Entscheidungsbaum und multinomiale Regression. Es wurden Tests zur Performance und Schätzungen zur Qualität durchgeführt. Dabei hat sich in diesem Kontext der Entscheidungsbaum als erfolgreichster Ansatz erwiesen.
 

Ergebnisse

Für die Haushalte der STATPOP von 2017 bis 2020 wurden zwei Versionen der Variable «Haushaltstyp» erstellt: In der einen liegt die Altersgrenze der Kinder bei 18 Jahren, in der anderen bei 25 Jahren.


Einschränkungen der Daten

Da die Variablen des Haushaltstyps STATPOP teilweise imputiert sind, eignen sie sich zwar als Analysevariable, sind jedoch für die imputierten Haushalte auf individueller Ebene nicht zwingend zuverlässig. In den Publikationen, die diese Information verwenden, muss vermerkt sein, dass es sich um experimentelle Variablen handelt.

Ausblick

Das BFS führt weitere Tests durch, um die Qualität der Imputationen und der Fehlerschätzungen zu verbessern. Abgesehen vom Entscheidungsbaum sind auch mit dem Random-Forest-Algorithmus noch Verbesserungen möglich. Das Ziel ist es, die Abweichungen zwischen den Ergebnissen der beiden «besten» Ansätze zu minimieren, um die Ergebnisse zu konsolidieren. Mittelfristig soll die Variable «Haushaltstyp» in die Standardproduktion der STATPOP integriert werden.


Dokumentation

Dieses methodologische Dokument ist nur auf Französisch verfügbar.



Auskunft, Datenbestellung und Rückmeldung

Kontakt: info.dem@bfs.admin.ch
Telefon: +41 58 463 67 11

Die Bereitstellung der Variablen auf der Basis einer experimentellen Statistik dient auch dazu, die Qualität der Ergebnisse zu überprüfen und allfällige Probleme zu identifizieren. Rückmeldungen sind daher willkommen.