{"id":1041,"date":"2013-08-31T09:30:50","date_gmt":"2013-08-31T07:30:50","guid":{"rendered":"http:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/?page_id=1041"},"modified":"2013-08-31T09:33:59","modified_gmt":"2013-08-31T07:33:59","slug":"was-kann-man-aus-meinungsumfragen-erschliesen-und-was-nicht","status":"publish","type":"page","link":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/was-kann-man-aus-meinungsumfragen-erschliesen-und-was-nicht\/","title":{"rendered":"Aussagekraft von Meinungsumfragen"},"content":{"rendered":"<p>Im Jahr 2013 kommen einige Wahlen und Volksbefragungen auf uns zu.<\/p>\n<p>Im J\u00e4nner die Volksbefragung zur Wehrpflicht, sp\u00e4testens im Oktober die Nationalratswahl, und vorher schon Landtagswahlen in K\u00e4rnten, Nieder\u00f6sterreich und Tirol.<br \/>\nIn Deutschland gibt&#8217;s Landtagswahlen in Niedersachsen, Bayern und Hessen und im September die Bundestagswahl.<\/p>\n<p>Daher liest und h\u00f6rt man immer wieder die Ergebnisse und Interpretationen von Meinungsumfragen. F\u00fcr einen Statistiker bedeutet das einen ziemliche hohen Leidensdruck, weil sehr oft aus Meinungsumfragen Dinge herausgelesen werden, die auch bei nachsichtigstem Umgang mit den Interpretatoren (in der Regel Journalisten und Politikern) jeder vern\u00fcnftigen statistischen Grundlage entbehren.<\/p>\n<p>Mit der folgenden Tabelle kann man 2 methodische Fragen beantworten:<\/p>\n<ol>\n<li>Wie gro\u00df ist die Schwankungsbreite f\u00fcr den Anteil einer Partei bei allen Wahlberechtigten, wenn er in \u00a0einer Stichprobe erhoben wurde?<\/li>\n<li>Kann man aufgrund einer Stichprobe sagen, dass eine Partei derzeit einen h\u00f6heren Anteil an allen Wahlberechtigten hat als eine andere Partei?<\/li>\n<\/ol>\n<div>Die Daten der Stichprobe m\u00fcssen in die umrandeten Felder eingegeben werden. Genauere Erl\u00e4uterungen folgen sp\u00e4ter. Eine Zusatzbemerkung ist aber noch notwendig. Oft (nicht immer) wird bei Meinungsumfragen die Stichprobengr\u00f6\u00dfe, also die Anzahl der Befragten, angegeben. Um die Schwankungsbreiten statistisch korrekt berechnen zu k\u00f6nnen, braucht man auch eine nahezu nie angegebene Kenngr\u00f6\u00dfe: den Anteil der validen Antworten \u2013 also jener Antworten, die auch auswertbar sind. Leider wird der praktisch nie angegeben; laut Auskunft von Dr. Beutelmeyer von <a title=\"market - Institut f\u00fcr Markt-, Meinungs-, und Mediaforschung\" href=\"http:\/\/www.market.at\">market<\/a>\u00a0liegt dieser Anteil typischerweise zwischen 70% und 80%.<\/div>\n<div><\/div>\n<div>Jetzt k\u00f6nnen sie einmal anfangen, mit der Tabelle Berechnungen \u00fcber die Schwankungsbreite anzustellen.<\/div>\n<div><\/div>\n<div>Im Ausgangszustand untersucht die Tabelle eine Umfrage unter 1000 Wahlberechtigten. Wir nehmen (idealisierenderweise) an, dass alle eine auswertbare Antwort gegeben haben. Im Ausgangsszenario hat eine Partei in der Umfrage 25,4% erreicht. Die Tabelle gibt dann die Auskunft, dass der Anteil dieser Partei an allen Wahlberechtigten zwischen 22,7% und 28,1% liegt, uns zwar mit 95%-iger Sicherheit.<\/div>\n<div>Das bedeutet, dass man, wenn man diese Formeln (bzw. eine derartige Tabelle) verwendet, 19 von 20 mal den Anteil an den Wahlberechtigten richtig eingrenzen wird, 1 mal von 20 mal aber falsch liegen wird!<\/div>\n<div><\/div>\n<div>Der untere Teil der Tabelle untersucht, ob man aus den Stichprobenergebnissen schlie\u00dfen kann, dass die Partei, die in der Stichprobe vor einer anderen liegt,<br \/>\nauch bei den Wahlberechtigten vorne liegt. Im Ausgangszustand der Tabelle liegt Partei A zwar in der Stichprobe vor Partei B, man kann aber nicht mit ausreichender Sicherheit sagen, dass das auch bei allen Wahlberechtigten der Fall ist. Ausreichende Sicherheit bedeutet \u00e4hnlich wie soeben, dass man eine Aussage machen will, bei der man als Statistiker berechnen kann, dass sie 19 von 20 mal richtig sein wird, wenn man das Verfahren oft verwendet.<\/div>\n<div><\/div>\n<div>Zum Durchrechnen andere Szenarien k\u00f6nnen sie die Zahlen in den umrandeten Feldern \u00e4ndern, die Tabelle rechnet dann sofort die neuen Schranken aus.<\/div>\n<div><\/div>\n<p><iframe src=\"https:\/\/skydrive.live.com\/embed?cid=495062CF0D0DB8FB&amp;resid=495062CF0D0DB8FB%21204&amp;authkey=ANlclDM8XYpWoks&amp;em=2&amp;wdAllowInteractivity=False&amp;AllowTyping=True&amp;Item='Sheet1'!A1%3AD25&amp;wdHideGridlines=True&amp;wdDownloadButton=True\" frameborder=\"0\" scrolling=\"no\" width=\"408\" height=\"540\"><\/iframe><\/p>\n<p>Sie k\u00f6nnen diese Excel-Tabelle auch auf ihren Rechner laden. Dazu m\u00fcssen sie nur auf das Excel-Symbol in der schwarzen Leiste unterhalb der Tabelle klicken.<\/p>\n<p>Wenn sie die Seite in ihrem Browser neu laden, dann sehen sie wieder die Tabelle mit den urspr\u00fcnglichen Werten.<\/p>\n<h2>Einige Zahlenspielereien<\/h2>\n<p>Typischerweise geben nicht alle Befragten eine auswertbare Antwort. Wie wirkt es sich denn aus, wenn nur 80% der Befragten eine auswertbare Antwort geben? Dann werden alle Schwankungsbreiten gr\u00f6\u00dfer, und etwas vereinfacht gesagt werden dann alle Schwankungsbreiten mit 1,1 multipliziert. Liegt der Anteil bei 70%, dann werden die Schwankungsbreiten ungef\u00e4hr mit 1,15 multipliziert. Sie k\u00f6nnen das in der Tabelle ausprobieren.<\/p>\n<p>Noch etwas kann man in der Tabelle nachrechnen: wenn man den Umfang der Stichprobe vergr\u00f6\u00dfert und dazu verdoppelt, dann wird die Schwankungsbreite nicht halb so gro\u00df, sondern etwa 70% so gross. Erst wenn man die Stichprobe 4x so gro\u00df wie urspr\u00fcnglich macht, dann wird die Schwankungsbreite halbiert. Die genauen Formeln finden sie im n\u00e4chsten Abschnitt.<\/p>\n<p>Die Tabelle illustriert eine weitere wichtige Tatsache: beim Vergleich der Anteile von zwei Parteien kann man nicht die Formel f\u00fcr die Schwankungsbreite f\u00fcr eine Partei verwenden. Folgender Schluss ist falsch:<\/p>\n<blockquote><p>Partei A hat in der Stichprobe 25,4%, und die Schwankungsbreite betr\u00e4gt 2,7%. Partei B hat 22,4%. Dieser Anteil (22,4%) liegt au\u00dferhalb des &#8222;Sicherheitsbereichs&#8220; (22,7% bis 28,1%) vom Partei A und daher kann man mit ausreichender Sicherheit sagen, dass Partei A auch bei allen Wahlberechtigten vor Partei B liegt.\n<\/p><\/blockquote>\n<p>Mann muss f\u00fcr den Schwankungsbereich der Parteiendifferenz eine eigene Formel verwenden, und in unserem Beispiel ergeben die Berechnungen, dass das Intervall f\u00fcr den Unterschied von -1,3% bis 7,3% geht. Es enth\u00e4lt also sowohl positive als auch negative Werte, und daher kann man nicht sagen, dass eine der beiden Parteien vor der anderen liegt.<\/p>\n<p>In vielen Tageszeitungen findet man Interpretationen von Meinungsumfragen, die die Schwankungsbereiche \u00fcberhaupt nicht ber\u00fccksichtigen. Die Situation bessert sich, Qualit\u00e4tszeitungen weisen mittlerweile schon \u00f6fter auf Schwankungsbreiten hin.<br \/>\nDie Schwankungsbreiten f\u00fcr Parteiendifferenzen werden aber kaum je verwendet. In der Folge wird oft davon gesagt oder geschrieben, dass eine Partei vor der anderen l\u00e4ge. Das stimmt dann meist in der Stichprobe; f\u00fcr die Grundgesamtheit aller Wahlberechtigten kann man das aber meist nicht mit ausreichender Sicherheit sagen.<\/p>\n<p>Ein kleines Beispiel: Hat man 2 Parteien, die sich im Bereich vom 20% bis 25% bewegen, dann kann man erst dann sagen, dass eine Partei vor der anderen liegt, wenn der Unterschied in der Stichprobe mindestens 4,4% betr\u00e4gt<\/p>\n<p>Noch eine Anmerkung: Die Tabelle kann man sinnvollerweise erst bei Stichprobengr\u00f6\u00dfen von mehreren hundert Befragten anwenden.<\/p>\n<h2>F\u00fcr welche Art von Stichproben funktioniert das?<\/h2>\n<p>Die Tabelle und die Formeln im n\u00e4chsten Abschnitt gehen davon aus, dass die Auswahl der Befragten per Zufallsstichprobe erfolgt.<\/p>\n<p>Man sollte also ein Verzeichnis aller W\u00e4hler haben und dann mit einem Zufallsmechanismus (meist sind das computergenerierte Zufallszahlen) die zu Befragenden aus dieser Liste ausw\u00e4hlen. Dieses Ideal ist sicher schwer zu erf\u00fcllen. Die entsprechenden Voraussetzungen werden sicher dann nicht eingehalten, wenn die einzelnen Interviewer selber die zu Befragenden bestimmen k\u00f6nnen, wie das bei manchen Varianten des Quotenverfahrens der Fall ist.<\/p>\n<p>Ein weit verbreitetes Missverst\u00e4ndnis besteht darin, zu glauben, dass die Repr\u00e4sentativit\u00e4t der Stichprobe das zentrale Qualit\u00e4tskriterium w\u00e4re. Das entscheidende Kriterium daf\u00fcr, dass unsere Tabelle und unsere Formeln die gew\u00fcnschte Treffsicherheit haben, ist die Zufallsauswahl. Eine korrekt durchgef\u00fchrte Zufallsauswahl liefert Repr\u00e4sentativit\u00e4t als Nebeneffekt.<\/p>\n<h2>Die Formeln<\/h2>\n<p>Jetzt geht&#8217;s ans Eingemachte. Wenn sie sich mit Formeln nicht sehr wohl f\u00fchlen, dann m\u00fcssen sie diesen Abschnitt nicht mehr lesen. Sie k\u00f6nnen die Tabelle weiter oben auch so verwenden, wenn sie die Erl\u00e4uterungen zur Tabelle ber\u00fccksichtigen.<\/p>\n<p>Die Basisformel f\u00fcr Umfragegenauigkeit lautet:<br \/>\nWenn wir in einer Umfrage mit $n$ Befragten in der Stichprobe eine Anteil von $\\hat{p}$ erhalten, dann berechnet man die Schwankungsbreite f\u00fcr die Sicherheit $\\alpha$ als<br \/>\n$$d=z_{\\alpha}\\sqrt{\\frac{\\hat{p}(1-\\hat{p})}{n}}$$ und der Bereich, in dem der entsprechende (unbekannte) Anteil an der Grundgesamtheit liegt, lautet $$\\hat{p}\\pm d$$<\/p>\n<p>$z_{\\alpha}$ ist ein Wert, den man in Normalverteilungstabellen nachschlagen kann. Der meist verwendete Wert ist $z_{0,95}=1,96$.<br \/>\nDas ergibt sich aus dem Anspruch, in 19 von 20 F\u00e4llen (also in 95% aller F\u00e4lle) eine korrekte Aussage zu machen. Stellt man h\u00f6here Sicherheitsanspr\u00fcche, dann verwendet man $z_{0,99}=2,58$. Dann sind die statistischen Schlussfolgerungen in 99 von 100 F\u00e4llen korrekt.<\/p>\n<p>Excel kann die Werte $z_{\\alpha}$ ebenfalls berechnen.<\/p>\n<p>Die statistisch-mathematisch korrekte Formulierung, die die Grundlage von Anteilsberechnungen bei Meinungsumfragen liefert, lautet:<\/p>\n<blockquote><p>Wenn der Anteil eines bestimmten Merkmals in einer Zufallsstichprobe vom Umfang $n$ den Wert $\\hat{p}$ hat, dann liegt der entsprechende Anteil in der Grundgesamtheit mit Sicherheit $\\alpha$ zwischen den Werten $\\hat{p}-z_{\\alpha}\\sqrt{\\frac{\\hat{p}(1-\\hat{p})}{n}}$ und $\\hat{p}+z_{\\alpha}\\sqrt{\\frac{\\hat{p}(1-\\hat{p})}{n}}$\n<\/p><\/blockquote>\n<p>Wenn wir die Anteile zweier Parteien in einer Stichprobe sch\u00e4tzen, dann lautet die statistisch korrekte Formulierung samt Formel:<\/p>\n<blockquote><p>Wenn die Anteile zweier einander ausschlie\u00dfender Merkmale in einer Zufallsstichprobe vom Umfang $n$ die Werte $\\hat{p}_A$ und $\\hat{p}_B$ und die Anteilsdifferenz daher die Werte $\\hat{p}_A-\\hat{p}_B$ haben, dann liegt die entsprechende Anteilsdifferenz in der Grundgesamtheit mit Sicherheit $\\alpha$ zwischen den Werten $\\hat{p}_A-\\hat{p}_B-z_{\\alpha}\\sqrt{\\frac{\\hat{p}_A+\\hat{p}_B-(\\hat{p}_A-\\hat{p}_B)^2}{n}}$ und $\\hat{p}_A-\\hat{p}_B+z_{\\alpha}\\sqrt{\\frac{\\hat{p}_A+\\hat{p}_B-(\\hat{p}_A-\\hat{p}_B)^2}{n}}$<\/p>\n<\/blockquote>\n<div class=\"tweet_button93\" style=\"float: right; margin-left: 10px;\"><a href=\"http:\/\/twitter.com\/share\" rel=\"nofollow\" class=\"twitter-share-button\" data-url=\"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/was-kann-man-aus-meinungsumfragen-erschliesen-und-was-nicht\/\" data-text=\"Aussagekraft von Meinungsumfragen - Bildung und Statistik\" data-count=\"vertical\" data-lang=\"de\" data-via=\"neuwirthe\"  data-related=\"\"><\/a><\/div>","protected":false},"excerpt":{"rendered":"<p>Im Jahr 2013 kommen einige Wahlen und Volksbefragungen auf uns zu. Im J\u00e4nner die Volksbefragung zur Wehrpflicht, sp\u00e4testens im Oktober die Nationalratswahl, und vorher schon Landtagswahlen in K\u00e4rnten, Nieder\u00f6sterreich und Tirol. In Deutschland gibt&#8217;s Landtagswahlen in Niedersachsen, Bayern und Hessen und im September die Bundestagswahl. Daher liest und h\u00f6rt man immer wieder die Ergebnisse und [&hellip;]<\/p>\n<div class=\"tweet_button93\" style=\"float: right; margin-left: 10px;\"><a href=\"http:\/\/twitter.com\/share\" rel=\"nofollow\" class=\"twitter-share-button\" data-url=\"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/was-kann-man-aus-meinungsumfragen-erschliesen-und-was-nicht\/\" data-text=\"Aussagekraft von Meinungsumfragen - Bildung und Statistik\" data-count=\"vertical\" data-lang=\"de\" data-via=\"neuwirthe\"  data-related=\"\"><\/a><\/div>","protected":false},"author":2,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"open","ping_status":"open","template":"","meta":[],"_links":{"self":[{"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/pages\/1041"}],"collection":[{"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/comments?post=1041"}],"version-history":[{"count":5,"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/pages\/1041\/revisions"}],"predecessor-version":[{"id":1046,"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/pages\/1041\/revisions\/1046"}],"wp:attachment":[{"href":"https:\/\/blogs.neuwirth.priv.at\/bildungundstatistik\/wp-json\/wp\/v2\/media?parent=1041"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}