Erste Anmerkungen zu den PISA-2018-Ergebnissen
Heute wurden die Ergebnisse den PISA-Tests 2018 publiziert.
Den Vergleich mit den früheren Ergebnissen zeigt folgende Grafik:
Mathematik für 2000 und Naturwissenschaften für 2000 und 2003 sind nur als Punkte dargestellt, weil diese Disziplinen erst später als Hauptdomäne analysiert wurden und die OECD diese Werte daher als nicht unmittelbar für Langfristvergleiche geeignet einstuft.
Die deutlichste Veränderung im Vergleich zu 2015 ist die Verschlechterung in den Naturwissenschaften, die vor auf das Konto der Buben geht. Im Rahmen der Messgenauigkeit gaben sich die Mädchen verbessert oder sind gleich geblieben.
Beim Lesen und in Mathematik ist der Gesamtscore im wesentlichen gleich geblieben. Allerdings ist der Unterschied zwischen Buben und Mädchen beim Lesen größer geworden, dieMädchen haben sich verbessert und die Buben haben sich verschlechtert. Bei Mathematik ist es umgekehrt, da haben sich die Mädchen verbessert un die Buben verschlechtert.
Es scheint es sinnvoll, die aktuellen Daten genauer zu analysieren um diese Unterschiede erklären und mögliche Gründe finden zu können.
Eine wichtige Anmerkung ist auch, dass die Tests bis 2012 mit Papier und Stift, 2015 und 2018 dann aber auf Computern durchgeführt wurden.
Ein Effekt war, dass in fast allen europäischen Länder der Geschlechterunterschied beim Lesen geringer wurde.
Was bedeuten die PISA-Score-Punkte eigentlich. Sie dienen dazu, den Anteil der Schüler, der eine bestimmte Aufgabe löst zu vergleichen.
Nehmen wir an, eine Aufgabe wurde beim ersten Test vom 50% der Schüler gelöst.
Wenn dann der PISA-Score um 10 Punkte abnimmt, dan bedeutet das beim Lesen, dass um 3.2% weniger Schüler (also nur 46.8%) der Schüler diese Aufgabe lösen können. Bei Mathematik bedeuten 10 Punkte weniger, dass der Anteil der Schüler, die die Aufgabe lösen können, um 2.8% abnimmt, und in den Naturwissenschaften
bedeuten 10 Punkte weniger, dass 2.7% weniger Schüler die Aufgabe lösen können.
Natürlich ist das eine vereinfachte Beschreibung, tatsächlich werden die Berechnungen über viele Aufgaben hinweg statistisch gemittelt.
Die Daten
Insgesamt:
Geschlechterweise getrennt:
Einige Zahlen in dieser Tabellen sind fett gedruckt. Warum?
Die OECD ist der Meinung, dass man Längsschnittvergleiche erst ab jenem Zeitpunkt machen sollte, an dem eine der 3 Domänen erstmals Hauptdomäne war. Das war bei Lesen 2000 (und 2009 und 2018), bei Mathematik 2003 (und 2012) und bei den Naturwissenschaften 2006 (und 2015). Das sind die fettgedrucken Zahlen.
Warum sind die Zahlen in der Zeile für das Jahr 2009 kursiv gedruckt? Die OECD schränkt (auch im oben verlinkten Bericht) die Interpretationsmöglicheiten der Ergebnisse für 2009 drastisch ein und meint, dass diese Zahlen für Längsschnittvergleiche nicht geeignet sind.
Zur Erinnerung: Damals gab es von manchen Schülervertretern einen Boykottaufruf und deswegen musste eine doch merkbare Anzahl von Testbögen als nicht auswertbar ausgeschieden werden. Das hat wahrscheinlich das Testergebnis für 2009 etwas verzerrt.
Lässt man 2009 einmal außer Acht, dann sind die Ergebnisse für Mathematik und Lesen für alle anderen Tests bis 2012 praktisch gleich.
Da kaum anzunehmen ist, dass es in einem doch recht trägen Bildungssystem innerhalb von 3 Jahren zu einem dramatischen Absturz und in den 3 folgenden Jahren zu einem Aufschwung zu alten Höhen kommt, sollte man die Abweichung der Ergebnisse von 2009 aufgrund einer deutlich anderen psychologischen Situation beim Tests mit höchster Vorsicht interpretieren. Das ist auch der Grund, warum die OECD diese Zahlen in manchen Berichten gar nicht veröffentlicht.