Guide: Wie lese ich eine Statistik?

„Traue keiner Statistik, die du nicht selbst gefälscht hast.“
(Winston Churchill zugeschrieben)

 

Was ist passiert?

Heute mal etwas, was immer aktuell ist und bleibt: Statistiken, und wie man diese richtig liest. Man findet sie immer und überall – ob nun in den Nachrichten als „Sonntagsfrage“ („Wie würden Sie wählen, wenn am nächsten Sonntag Bundestagswahl wäre?“), oder in der Gala, in welcher darüber abgestimmt wird, ob die Ehe von zwei Prominenten hält oder nicht. Und egal, auf welchem Terrain man sich bewegt, die Probleme mit Statistiken bleiben immer dieselben. Winston Churchill – sofern er es denn wirklich war – hatte mit seinem Ausspruch ganz recht, daher kann man ihn immer und immer wieder aufwärmen. Besonders dann, wenn man zu hören bekommt, „alle“ Deutschen würden dieses und jenes denken, oder „alle“ Autofahrer sind für dieses und jenes Gesetz. Nein, einfach nein.

Statistiken sind niemals für bare Münze zu nehmen. Warum nicht? Ein paar Gründe kommen sofort.

Was meine ich dazu?

1.Was bedeutet Repräsentativität?

Viele Umfragen rühmen sich damit, „repräsentativ“ zu sein, d.h. dass sie ein verkleinertes Abbild einer gewissen Population – wie z.B. allen Deutschen – darstellen würden. Das ist so nicht richtig, denn jede Umfrage ist eine Zufallsstichprobe, und wird häufig nach bestimmten Quoten gezogen. Ein Beispiel ist, dass eine gewisse Prozentzahl an Leuten über 60 in der Stichprobe sein müssen. So werden zwar z.B. alle Bevölkerungsgruppen berücksichtigt, aber niemals alle Bewohner Deutschlands. Das ist gar nicht möglich, und das will ich ja gar nicht behaupten. Aber Sätze wie „die Deutschen würden so und so wählen“ sind falsch und führen in die Irre. Es besteht eine gewisse Wahrscheinlichkeit, dass die Deutschen so und so wählen würden, aber ob sie es auch wirklich tun…? Das ist eine andere Sache.

2. Wie groß ist das n?

Eng verwandt mit dem ersten Punkt ist die Frage nach dem „n“, d.h. die Frage nach der Teilnehmerzahl der Befragung. Wenn nur zehn Leute an einer Umfrage teilnehmen, kann ein ganz anderes Ergebnis herauskommen, als wenn 20 Leute ihre Stimme abgeben. Anders gesagt: bloß weil, nehmen wir an, 86 % eine Sache ablehnen, kann das unter Umständen gar nichts aussagen, wenn die Teilnehmerzahl sehr klein ist. Häufig wird das n aber nicht genannt, selbst in sogenannten Qualitätszeitungen nicht, was ich persönlich für einen groben Fehler halte. Wie soll man so feststellen, wie viele Leute sich wirklich geäußert haben?

 

(Abbildung von mir – Hier macht ein kleines n groß Furore)

3. Wie sind die Daten dargestellt?

Ein nächster Punkt, der den Betrachter in die Irre führen kann, und manchmal vielleicht sogar soll. Denn hier geht es darum, wie z.B. bei einem Balkendiagramm die Achsen beschriftet sind. Werden die Einheiten auf den Achsen stark unterschiedlich dargestellt, kann eine hohe Kurve entstehen und damit eine Wichtigkeit vortäuschen, die er bei einer anderen Darstellung gar nicht hätte. Es geht um den ersten Blick, und wenn der die Kurve einen großen Sprung macht oder der Balken sehr hoch ist, dann muss an der Umfrage etwas Dramatisches dran sein, das mag sich dann der Betrachter nach einem flüchtigen Blick denken – obwohl dem gar nicht so ist. Aber das alles setzt voraus, dass die Achsen überhaupt mit Einheiten beschriftet sind – wenn nur eine Kurve quasi im luftleeren Raum schwebt, sagt das nun wirklich überhaupt nichts aus.

(Abbildung von mir – Von der Verpackung eines Energy-Drinks. Wieviel Zeit vergeht?
Und was ist eigentlich „Energie“?)

4. Wie wurde befragt?

Das ist gerade bei den vielen technischen Möglichkeiten, die zur Verfügung stehen, ein wichtiger Punkt. Wie wie ist die Befragung vonstatten gegangen, die zu dieser Statistik geführt hat? Per Telefon? Oder per Internet? Gerade letzteres muss mit einem gesunden Misstrauen beobachtet werden. Denn bei einer Telefonbefragung ist es sehr unwahrscheinlich, dass jemand mehrfach angerufen und befragt wird – bei einer Onlineumfrage ist es prinzipiell aber möglich, so häufig abzustimmen, wie man möchte. Das kann das Ergebnis stark verfälschen.

Aber nicht nur die Technik ist wichtig, sondern auch das ‚Wie’ der Fragen. Ist eine Frage nämlich schwer verständlich (weil z.B. mit doppelter Verneinung „um die Ecke gestellt“), kann es zu Verzerrungen kommen, ebenso bei Suggestivfragen. Das sind Fragen, die nicht neutral gestellt werden, ein Extrembeispiel hierfür ist „War der taktlose Rausschmiss des armen Norbert Röttgen ein schlimmer Fehler, ja oder nein?“. Hier wird eine bestimmte Antwort nicht nur implizit gewünscht.

Fazit

Es gibt natürlich noch mehr Dinge, die es beim Lesen von Statistiken zu beachten gibt, aber ich denke, hier ein paar sehr wichtige aufgeführt zu haben. Vorsicht ist also allerorten geboten. Das heißt aber nicht, dass alle Statistiken „lügen“ – nein, das heißt nur, dass sie immer genau betrachtet werden sollten, damit man selbst den Wert einer Statistik erkennen kann. Hält eine Umfrage das, was sie verspricht? Mit ein paar Gedanken lässt sich das schnell prüfen.

Das war’s jetzt aber erstmal mit grauer Theorie – im nächsten Post gibt es wieder etwas Aktuelles.

Worauf stützt sich dieser Blogpost?

  • – eigene Beobachtungen
  • – Literaturtipp: Diekmann, Andreas (2008): Empirische Sozialforschung. Grundlagen. Methoden. Anwendungen. Hamburg: Rowohlt. (für alle, die sich tiefer einlesen wollen)

_____________________________________________________________________________________________________

Advertisements

Kommentar schreiben

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

w

Verbinde mit %s