Viele Städte und Regionen erhoffen sich durch das SrV Mobilitätsdaten, die Quervergleiche ermöglichen und die zeitliche Entwicklung abbilden. Die gewählte Erhebungsmethodik wird diesem Anliegen nur begrenzt gerecht.

Das System repräsentativer Verkehrsbefragungen (SrV)

In der DDR wurde anfangs der siebziger Jahre von der TU Dresden eine Methode für Mobilitätsbefragungen in Städten entwickelt, erstmals 1972 eingesetzt und in regelmäßigen Abständen (fünf Jahre) wiederholt. Zugrunde lag ein tagebuchähnlicher Fragebogen, befragt wurde mündlich, an den Tagen Dienstag bis Donnerstag („mittlerer Werktag“) und jeweils im Frühjahr.

Ich kam in den frühen achtziger Jahren in Kontakt mit den SrV-Gründern und bereits im November 1989 kam es zu einem ersten persönlichen Treffen. Ein ausführlicher Besuch in Dresden 1990 schloss sich an, unsere erste Mobilitätsbefragung haben wir (Socialdata) im März 1990 in Leipzig durchgeführt; damals gab es noch Ostgeld.

Ein Vergleich von SrV-Methodik und -Daten zeigte rasch, dass die Design-Unterschiede zwischen SrV und dem KONTIV-Design behebbar waren. Als Folge haben wir einen vergleich­baren Städtebestand in der BRD gebildet und einen Städtepegel „Alte und Neue Länder“ für 1972, 1977, 1982 und 1987 erstellt.

Schnell hat sich auch das Bundesverkehrsministerium für Mobilitätsdaten in der DDR interessiert und drei Projekte geplant: Eine aktuelle SrV-Erhebung 1991, eine vergleichbare Erhebung in ländlicheren Regionen der DDR und eine Fortschreibung der SrV-Methodik auf den aktuellen Stand im wiedervereinigten Deutschland. Mit dem ersten Projekt wurde die TU-Dresden, mit dem zweiten Socialdata betraut. Das dritte Projekt sollten wir gemeinsam durchführen; daran wollte sich die TU-Dresden aber nicht mehr beteiligen.

Wir haben die Idee des Städtepegels in Ost und West weitergeführt und Ergebnisse im Fünfjahres-Rhythmus bereit gestellt (derzeit bis 2012). Dabei wurden die Daten so weit angeglichen, dass sie alle Wochentage und den Durchschnitt eines ganzen Jahres abbilden. Dieser Datenbestand ist weltweit einmalig, weil er eine maximale Veränderung vieler Randbedingungen und deren Auswirkungen auf die Mobilität abbildet und damit verlässliche Auskunft über Konstante und Variable des jeweiligen Verhaltens erlaubt. Seine Präsentation war ein Höhepunkt der Konferenz der Europäischen Verkehrsminister (CEMT) in Wien (1995).

In Ost-Deutschland wurden dann – mit relativ „altem Design“ – weitere Erhebungen 1994 und 1998 durchgeführt, bis dann im Jahre 2003 eine „neue Ära“ für das SrV anbrach. Im Fahrwasser der Mobilitätserhebung in Deutschland (MiD) wurde das dort eingesetzte Design für die Erhebungen 2003 verwendet. Das hat dem SrV nicht gut getan, denn das MiD-Design war (und ist noch immer) für die Durchführung verlässlicher Mobilitätserhebungen nur bedingt geeignet. Entsprechend sank die Antwortquote im SrV 2003 auf 32 % und 2008 sogar auf 26 %. Das veranlasste die – nach wie vor federführende – TU-Dresden dazu, in einer umfassenden Methodenstudie nach Hinweisen zu suchen, wie die Teilnahmebereitschaft der Befragten verbessert und damit die Qualität der Ergebnisse gesteigert werden kann.

Die Stunde der Wahrheit

Am 10.11.2014 wurden dann die Ergebnisse der neuen SrV-Erhebung (2013) in Dresden präsentiert. Die Vorträge hatten pfiffige Titel: „Die Stunde der Wahrheit“, „Die Kunst des Kontaktens“ oder „Die (Stich-)probe aufs Exempel“ und der Saal war gut gefüllt. (sämtliche Vorträge - auf die wir uns hier auch beziehen - sind unter http://tu-dresden.de/die_tu_dresden/fakultaeten /vkw/ivs/srv/2013 verfügbar).

Und es war in der Tat eine Stunde der Wahrheit. Trotz aufwändiger Methodenstudie sank der Rücklauf weiter ab und erreichte mit 23 % den bisherigen Tiefstand. Anstatt die Kunst des Kontaktens zu pflegen, wurden wichtige Erfolgsgaranten einer Mobilitätsbefragung über Bord geworfen (z. B. „Verzicht auf den Einsatz klassischer Papierfragebogen“ oder „Versand von Schreiben ohne Stichtagsbezug mit Infopost“).

Unplausibel sind auch die erzielten Antwortquoten. Dabei geht es nicht nur darum, dass der gesamte Rücklauf über die ca. 100 Städte/ Regionen mit 23 % viel zu gering ist, sondern darum, dass auch die einzelnen Antwortquoten zwischen 8 und 50 % variieren:

HH ohne direkt Tel. Nr. 8 % ..... (19 %) ….... 32 % HH mit direkt Tel. Nr. 19 % ...… (32 %) …... 50 % Alle HH (ca. 2/3 zu 1/3) 11 % ... (23 %) …... 40 %

Danach läge die Antwortquote für alle Haushalte (Durchschnitt 23 %) zwischen 11 und 40 % und für Haushalte mit direkt verfügbarer Telefonnummer zwischen 19 und 50 % (Durchschnitt 32 %). Derart große Unterschiede (zwischen 11 und 40 % wäre mehr als das Dreieinhalbfache!) sind bei seriöser Feldarbeit nicht vorstellbar. Und: Beweist nicht gerade diese Aufgliederung, dass es sehr wohl möglich ist, Antwortquoten zumindest im Bereich der 50 %-Marke zu erzielen?

Für wirkliche Unruhe unter den SrV-Teilnehmern sorgte aber etwas anderes: Die Wege-Anzahl (Wege pro Person/Tag 2003: 3,04; 2008: 3,07) stieg 2013 auf 3,58. Das wurde begründet mit einer „präziseren Wegeerfassung“ und – an anderer Stelle – einer „systematischen Untererfassung kurzer Fußwege und Aktivitätsverknüpfungen zu Fuß und im MIV“. Den Teilnehmern wurde empfohlen, ihre Werte anhand eines „Verfahrens zur Aktualisierung stadtspezifischer SrV-Kennwerte für 2003 bzw. 2008“ zu ändern:

Systematisch untererfasste Wege nennt man non-reported trips (NRT). Es gibt sie in jeder Erhebung und ihr Umfang hängt ab vom jeweiligen Methoden-Design. Nach dem vorliegenden Beispiel gäbe es NRT nur bei zu Fuß und beim MIV (ohne Unterscheidung nach Pkw-Fahrer und –Mitfahrer). Und die absolute Größe der NRT wäre gleich in allen Städten (mit hohem oder niederen Fußwege-Anteil) und in allen Jahren (2003, 2008, 2013). Das muss man nicht kommentieren.

mobilogisch!-Lesern könnte da ein Artikel von mir aus dem August 2012 einfallen. Da habe ich – mit den wenigen Informationen, die mir zugänglich waren – versucht, den Anteil der NRT abzuschätzen. Das Ergebnis war: NMV 0,25 (0,21 zu Fuß, 0,04 Fahrrad), MIV 0,19 (0,12 Pkw-Fahrer, 0,07 Pkw-Mitfahrer) und 0,06 ÖPNV. Und insgesamt ein Anstieg von 3,08 auf 3,58.

Der Unterschied zwischen SrV 2008 (3,07 und dem korrigierten SrV 2013 (3,58) ist mit 0,20 Fußwegen und 0,15 MIV nicht vollständig erklärt. Aber vielleicht gab es doch NRT bei Rad und ÖPNV? Dann wäre die rückwirkende Korrektur, die zu einer empfindlichen Absenkung der relativen Anteile dieser beiden Verkehrsmittel führt, falsch.

Und noch etwas: Beim SrV 2013 wird ausgiebig mit statistischer Signifikanz argumentiert, also dem Zufallsfehler (der entsteht, weil wir nur Stichproben und nicht totale Populationen befragen). Eine weit größere Fehlerquelle sind aber die sog. systematischen Fehler, die aus Mängeln im Design und/oder seiner praktischen Umsetzung resultieren. Der gezeigte Effekt (Untererfassung von Wegen) ist ein klassisches Beispiel für einen systematischen Fehler. Im Beispiel hat er die Größe von 0,20 Fuß-Wegen (das sind in der Beispielstadt 24 %). Bei einer Stichprobengröße von 1.000 Personen ist dieser (systematische) Fehler etwa viermal so hoch wie der Zufallsfehler, bei einer Stichprobe von 4.000 etwa achtmal so hoch. Vor diesem Hintergrund relativieren sich viele Aussagen, die mit der statistischen Signifikanz argumentieren. Und dabei haben wir jetzt nur einen von vielen systematischen Fehlern betrachtet.

Vergleichsbestand

Tatsächlich kann man systematische Fehler nicht genau messen. Es gibt aber eine Faustregel die besagt, dass die Antwortquote höher ist, wenn die Befragten das Thema interessiert und wenn ein Design gewählt wurde, das ihnen die Teilnahme leicht macht. Ein solches Design muss sehr professionell sein und erzeugt – in Konsequenz – weniger systematische Fehler. Damit ist die Antwortquote ein Indikator für die Qualität einer Befragung jenseits der statistischen Signifikanz ihrer Ergebnisse. Für den Nachweis dieses Zusammenhanges braucht man vergleichbare Befragungen mit unterschiedlichen Antwortquoten.

Einen solchen Anspruch erfüllt eine hoch ausgeschöpfte schriftlich/postalische Befragung. Denn dort antworten ja nicht alle Haushalte zur gleichen Zeit, man kann den Rücklauf nach einer bestimmten Zahl von Tagen abschneiden und damit verschiedene Antwortquoten simulieren.

Zu diesem Zweck haben wir unsere KONTIV-Erhebungen (ganze Jahre, alle Wochentage) in Augsburg, Fürth, Halle und Nürnberg für die Jahre 2002 bis 2009 zusammengespielt. Das ergab einen Bestand von knapp 36.000 Personen. Die Antwortquote lag bei 83 %. Auch bei einer so hohen Ausschöpfung gibt es noch immer 17 % der Haushalte in der Stichprobe, die sich nicht beteiligt haben. Man darf nicht annehmen, dass dieses Sechstel sich genauso verhält wie die Antworter. Deshalb haben wir eine (echte) non-response Untersuchung durchgeführt und die Ergebnisse korrigiert. Danach ergaben sich bei einem Außer-Haus-Anteil von 84 % pro mobiler Person 3,76 Wege und eine durchschnittliche Zahl aushäusiger Aktivitäten (für alle Personen) von 1,79 (ausgewertet - gemäß SrV - für Dienstag bis Donnerstag):

Unterteilt man jetzt diesen Bestand nach Rücklaufgruppen von 24 % (die in etwa dem Rücklauf der SrV entsprechen) bis 83 %, so ergibt sich ein bekanntes (und plausibles) Bild: Das Interesse an einer Mobilitätserhebung steigt mit der eigenen Mobilität. Das hat auch Auswirkungen auf andere Variable wie beispielsweise die Verkehrsmittelwahl, die Wegezwecke, usw. Im SrV liegen die Antwortquoten zwischen 11 % und 40 %; schon alleine aus diesem Grund sind viele Städte/Regionen nicht miteinander vergleichbar.

Wichtig ist dabei auch der Anteil an non-reported trips. Er ist nahezu unabhängig von der Rücklaufstufe. Die gängige Meinung, Spät-Antworter hätten nur deshalb weniger Wege, weil sie keine Lust haben, über alle zu berichten, bestätigt sich nicht.

SrV-Simulation

Um jetzt zeigen zu können, dass geringere Antwortquoten zu instabileren Ergebnissen führen, haben wir unseren Bestand zufällig in fünf Teile geteilt und diese Teile ausgewertet für Gesamt (83 % Rücklauf) und für 24 % Rücklauf (vergleich­bar zum SrV; mit den dort üblichen Fallzahlen zwischen 1.000 und 1.026 Personen).

Eine zufällige Aufteilung des Gesamt in fünf Teilbestände zeigt, dass es nur geringe Unterschiede bei der Mobilität gibt und dass die Unterschiede bei der Verkehrsmittelwahl sehr gering sind.

Dieses Bild ändert sich deutlich, wenn man die fünf Teilbestände bei 24 % Antwortquote betrachtet. Jetzt liegt die Mobilität zwischen 94 % (vom Durchschnitt) und 107 % und die Anteile der einzelnen Verkehrsmittel unterscheiden sich z. T. deutlich. Schlechte Ausschöpfung verstärkt die „Unruhe“ bei Mobilitätsdaten und verringert die Vergleichbarkeit spürbar. Dabei vergleichen wir hier fünf Bestände mit gleicher (wenn auch niedriger) Antwortquote. Im SrV gibt es für jede Region/Stadt andere Antwortquoten und die gezeigten Effekte sind sicher noch größer.

Als teilnehmende Region/Stadt an SrV muss man also damit rechnen, dass beispielsweise für den Pkw-Fahrer anstatt des (wahrheitsnahen) Wertes von 33 % ein Wert zwischen 31 und 38 % gemessen wird. In der folgenden Tabelle vergleichen wir diese statistische Abweichung mit der Differenz aus dem jeweils niedersten und höchsten Verkehrsmittel-Anteil in den fünf Beständen. Damit kann man feststellen ob die Unterschiede zwischen den einzelnen Beständen innerhalb des statistischen Schwankungsbereiches liegen. Ist das nicht der Fall, dann sind die Bestände nicht unmittelbar miteinander vergleichbar.

Man kann eine ähnliche Auswertung natürlich für viele andere Variablen der Mobilität durchführen. Das würde den Rahmen eines solchen Beitrages sprengen. Deshalb stellen wir hier nur (in vergleichbarer Form) die zusammenfassende Bewertung für die Wegezwecke vor.

Es zeigt sich in beiden Fällen, dass alleine durch den schlechteren Rücklauf Abweichungen zwischen den Beständen entstehen, die mit statistischen Konfidenzintervallen nicht erklärt werden können. Eine Vergleichbarkeit der Ergebnisse horizontal (Städtevergleich) und vertikal (Zeitreihen) ist damit eingeschränkt.

Um diese Situation zu verbessern, muss man nicht 83 % Rücklauf erreichen. Wir haben Beispielrechnungen für 40 und 55 % durchgeführt und jedes Mal wird die Stabilität der Ergebnisse größer und die Vergleichbarkeit besser.

 

 

Weiter ...

Das SrV hat Zukunft

Das SrV ist ein wichtiges Instrument in der Mobilitätsforschung, das in seiner Bedeutung gar nicht hoch genug eingeschätzt werden kann. Es hat seit der Wiedervereinigung an seiner praktischen Umsetzung gelitten. Das wurde bei der Vorstellung der jüngsten Ergebnisse sehr deutlich und muss sich ändern. In schwierigen Zeiten hilft keine Blackbox sondern nur das beste methodische Design und eine saubere, nachvollziehbare empirische Umsetzung. Daran sollten sich alle einschlägig befassten Akteure beteiligen. Das SrV hat es verdient.

In Kürze

In der empirischen Forschung wird viel über (statistische) Repräsentanz geredet und wenig über Fehler, die durch das jeweilige Methoden-Design und seine Umsetzung entstehen (systematische Fehler). Das ist der falsche Ansatz, Abhilfe kann aber nur geschaffen werden, wenn sich alle betroffenen Akteure intensiver mit den Erhebungsprozessen befassen.

 

Dieser Artikel von Werner Brög ist in mobilogisch! , der Vierteljahres-Zeitschrift für Ökologie, Politik und Bewegung, Heft 1/2015, erschienen. 

Einzelhefte von mobilogisch! können Sie in unserem Online-Shop in der Rubrik "Zeitschrift - Versand Hefte" bestellen.