Lernstandserhebung : Warum sich die Vergleichsarbeiten VERA ändern müssen

Der Schock nach dem dramatischen Leistungsabfall beim letzten IQB-Bildungstrend in den vierten Klassen saß tief. Bildungsforscher Horst Weishaupt hat sich die VERA3-Ergebnisse der vergangenen Jahre in einigen Bundesländern genauer angesehen. War der Trend bei den Vergleichsarbeiten am Ende der dritten Klasse schon absehbar? Dabei machte Weishaupt eine erstaunliche Entdeckung: Die Ergebnisse in den dritten Klassen bei den VERA3-Arbeiten unterscheiden sich kaum von den IQB-Ergebnissen ein ganzes Schuljahr später, teilweise fallen die Tests in den vierten Klassen sogar schlechter aus als noch in der dritten Klasse. Im Interview erklärt Weishaupt, wie es dazu kommt und was passieren müsste, um die in Verruf geratenen VERA-Tests zu einem sinnvollen Instrument der Schul- und Unterrichtsentwicklung zu machen.

Ein Kind gibt dem Lehrer einen Test
Die Vergleichsarbeiten VERA3 werden am Ende der dritten Klasse geschrieben und sollen Aufschluss über den Lernstand geben.
©iStock

Schulportal: Herr Weishaupt, woran liegt es, dass sich die Kompetenzen der Schülerinnen und Schüler innerhalb eines Schuljahres kaum verändert oder sogar abgenommen haben? Lernen sie im Unterricht nichts dazu?
Horst Weishaupt:
VERA3-Tests werden am Ende der dritten Klasse durchgeführt, mit dem Ziel, Informationen darüber zu erhalten, wo die Schülerinnen und Schüler voraussichtlich am Ende der vierten Klasse stehen und ob sie die Bildungsstandards am Ende der Grundschule erreichen werden. Es sind also prognostisch gedachte Erhebungen, praktisch als Frühwarnsystem.

Das Problem: Bei den Tests in der dritten Klassen müssten tatsächlich jene Kompetenzen abgefragt werden, die erst am Ende der vierten Klasse erreicht werden sollen. Die Schülerinnen und Schüler der dritten Klassen würden zwangsläufig viele Aufgaben noch nicht lösen können. Man hätte aber Hinweise darauf, was noch bis zum Ende der vierten Klasse gelernt werden müsste. Nur wenn in den dritten und vierten Klassen die gleichen Kompetenzen mit den gleichen Aufgaben getestet werden, wäre auch eine Leistungsentwicklung messbar.

Und das wird nicht gemacht?
Nein. Um die Schülerinnen und Schüler mit den Vergleichsarbeiten in den dritten Klassen nicht zu frustrieren, weil sie viele Aufgaben nicht lösen können, versucht man eine mittlere Aufgabenschwierigkeit zu finden, bei der die Lösungswahrscheinlichkeit bei 50 bis 60 Prozent liegt. Da jährlich neue Aufgaben verwendet werden, scheint die Aufgabenschwierigkeit zwischen den Jahren aber nicht konstant zu sein. Von diesen Ergebnissen wird dann die Lernentwicklung bis zum Ende der vierten Klasse vorhergesagt. Am Ende der vierten Klasse werden dann aber beim IQB-Test Aufgaben mit einem meist höheren Schwierigkeitsgrad verwendet.

Das würde die Tatsache erklären, dass die IQB-Ergebnisse ein Jahr später teilweise schlechter oder gleich gut ausfallen und kein Kompetenzzuwachs zu erkennen ist?
Genau. Ich habe die Ergebnisse in den Berichten zu den VERA3-Tests von mehreren Bundesländern im letzten Jahrzehnt zusammengestellt und mit den IQB-Bildungstrend-Ergebnissen 2011, 2016 und 2021 verglichen. Häufig wird zur Begründung dieser Tatsache behauptet, die Lehrkräfte würden in den dritten Klassen möglicherweise mogeln und den Kindern helfen. Das halte ich für Unterstellungen, die nicht haltbar sind. Man würde das auch an den Daten erkennen, weil man unerwartete Unterschiede sehen würde zwischen denen, die mogeln, und denen, die nicht helfen. Das geben die Daten aber nicht her. Überprüfungen haben zudem gezeigt, dass die Lehrkräfte die Vergleichsarbeiten sehr gewissenhaft durchführen.

Und die Verwendung unterschiedlicher Schwierigkeitsgrade konnten Sie dagegen nachweisen?
Ja, wir haben die VERA3-Daten von Rheinland-Pfalz ausgewertet und stellten dabei fest, dass sich die Schülerergebnisse in den dritten und vierten Klassen kaum unterscheiden, obwohl ein ganzes Schuljahr dazwischen liegt. Als Erklärung kam nur in Frage, dass einfachere Aufgaben für die dritten Klassen gestellt wurden.

Wie geht das, die Aufgaben werden doch zentral vom IQB entwickelt?
Das IQB stellt die Aufgaben für die Bildungsstandards am Ende der vierten Klasse mit unterschiedlicher Aufgabenschwierigkeit zusammen, die Länder wählen dann daraus aus für den VERA-Test. Welche Schwierigkeitsgrade sie dabei wählen, ist den Ländern überlassen.

Und jedes Bundesland entscheidet für sich? Eine Vergleichbarkeit wäre damit unmöglich?
So ist es, NRW hat jetzt explizit kommuniziert, dass das Land bei den VERA-Aufgaben eine Lösungswahrscheinlichkeit von 50 bis 60 Prozent anstrebt. Damit ist klar, dass es hier in den dritten Klassen eine leichtere Aufgabenzusammenstellung gibt als in den vierten Klassen. Da die Ergebnisse in Baden-Württemberg, Bayern, Rheinland-Pfalz und Schleswig-Holstein ziemlich ähnlich sind, kann man davon ausgehen, dass hier genauso verfahren wird, auch wenn das nach außen nicht kommuniziert wird. Vielleicht gibt es da sogar Absprachen unter den Ländern, öffentlich diskutiert wird das jedoch nicht. Die Öffentlichkeit wird teilweise falsch, aber in jedem Fall unzureichend darüber informiert.

Bisher geht man ja davon aus, dass die Ergebnisse von VERA nur für den internen Gebrauch sind, damit die Lehrkräfte sehen, wo ihre Schülerinnen und Schüler stehen. Die IQB-Tests dagegen sind ein Instrument des Bildungsmonitorings auf Länder- und Bundesebene. Das sind zwei verschiedene Ansätze. Warum wäre es denn aus Ihrer Sicht wichtig, die Ergebnisse der VERA-Tests mit denen der IQB-Tests verbinden zu können?
Wir könnten dann genau beantworten, welchen Leistungszuwachs die Schülerinnen und Schüler zwischen der dritten und vierten Klasse haben. Es wäre auch ein Zeichen der Bildungsverwaltungen, dass sie die VERA-Tests wirklich ernst nehmen für ihr Bildungsmonitoring.

Beide Untersuchungen sind schließlich Teile der Bildungsmonitoring-Strategie der Kultusministerkonferenz. Genauso wie die internationalen Vergleichsstudien mit dem IQB-Bildungstrend verzahnt sind, etwa über methodische Abstimmungen, müsste auch der IQB Bildungstrend mit VERA koppelbar sein. Hamburg zum Beispiel wertet die KERMIT-Tests, wie die Vergleichsarbeiten hier heißen, in den fünften Klassen im Vergleich mit den IQB-Ergebnissen am Ende der vierten Klassen aus. Die Hansestadt ist bisher das einzige Bundesland, das den Antrag gestellt hat, die IQB-Ergebnisse mit den landeseigenen Tests zu kombinieren.

Selbst für die interne Unterrichtsentwicklung werden die Ergebnisse von den Schulen oft wenig genutzt. Warum ist VERA so ein ungeliebtes Instrument geworden, schließlich wird doch viel Aufwand dafür getrieben?
Es gab schon immer Widerstände gegen dieses Instrument. Anfangs hatten die Lehrkräfte befürchtet, dass sie mit den Tests kontrolliert werden sollen. Sie haben es also weniger als Instrument zur eigenen Unterrichtsentwicklung gesehen. Und zunehmend wird auch hier die gesellschaftliche Spaltung deutlich. Es gibt Schulen, die sich nach den VERA-Tests zurücklehnen, weil die Schülerinnen und Schüler aufgrund der leichteren Aufgaben scheinbar schon die Standards der vierten Klasse erreicht haben.

Die anderen Schulen, die schlechter abschneiden, haben meist einen hohen Anteil von Kindern mit Migrationshintergrund, kombiniert mit einer hohen Armutsgefährdung. Allein mit Unterrichtsentwicklung ist diesen Schulen nicht geholfen, um Sprachdefiziten und den psychosozialen Folgen von Armut zu begegnen. Sie fühlen sich hilflos angesichts der Herausforderung und müssten vom Land viel stärker unterstützt werden. In Rheinland-Pfalz bekommen beispielsweise drei Prozent der Schulen, die in besonders herausfordernden Lagen sind, 10.000 Euro pro Jahr zusätzlich. Das ist viel zu wenig. Es gibt zwar auch Länder wie NRW, die zusätzliche Lehrerstellen nach Sozialindex zuweisen, doch meist können damit gerade einmal langfristige Ausfälle durch Krankheiten einigermaßen ausgeglichen werden. Für Zusatzangebote, etwa in der Sprachförderung, reicht das nicht aus. Schulen, bei denen die VERA-Ergebnisse zeigen, dass sie massive Probleme haben, werden alleingelassen. Die Schulaufsicht nutzt die VERA-Ergebnisse kaum, um auf die belasteten Schulen zuzugehen, weil sie ihnen gar nichts anbieten können, und selbst einige Kultusministerien haben wenig Interesse an den Ergebnissen der VERA-Tests. In Baden-Württemberg gab es sogar schon eine Kritik des Landesrechnungshofs, dass mit öffentlichen Mitteln Erhebungen durchgeführt werden, die von der Schulverwaltung gar nicht genutzt werden.

Wäre es sinnvoll, die VERA-Ergebnisse zu nutzen, um zu entscheiden, welche Schulen zusätzliche Mittel bekommen?
Dafür wäre aus meiner Sich ein Sozialindex geeigneter. Auch Schulen in schwierigen sozialen Lagen mit guten Leistungen der Schülerinnen und Schüler sollten zusätzliche Mittel erhalten. Die Schulaufsichten müssten einen Topf haben, aus dem sie Mittel genau an jene Schulen verteilen, die in einem sozial schwierigen Gebiet liegen. Und das geht nicht mit kleinen Beträgen, sondern nur mit massiver Unterstützung nach Sozialindex. Die meisten Bundesländer halten jedoch immer noch an einer gleichmäßigen Verteilung der Lehrerstellen nach der Zahl der Klassen fest.

Könnte man sich den Aufwand mit den VERA-Tests dann nicht besser sparen?
So wie es momentan gehandhabt wird, kann man die Lehrkräfte verstehen, die sagen, das sei kein wirkungsvolles Instrument. Ich finde die Tests aber wichtig, denn damit gibt es auch eine Rechenschaftspflicht der Lehrkräfte. Die Tests müssten nur anders ausgestaltet werden. Zusätzlich ist es wichtig, sich jene Schulen anzusehen, die erwartungswidrig schlechte Ergebnisse in den Tests zeigen, hier sind dann andere Maßnahmen zur Schul- und Unterrichtsentwicklung nötig. Um zu überprüfen, ob die Maßnahmen fruchten, wäre es wichtig, in den folgenden Jahren zu schauen, ob es einen Leistungszuwachs gibt. Dafür müssten es aber immer gleich schwierige Aufgaben sein. Wir brauchen mit VERA ein regelmäßiges Monitoring, der Abstand der IQB-Tests von fünf Jahren ist einfach zu lang. Zudem handelt es sich beim IQB-Bildungstrend um relativ kleine Stichproben, während die Vergleichsarbeiten VERA flächendeckend in allen dritten Klassen durchgeführt werden.

Was müsste sich denn methodisch ändern, damit VERA zu einem sinnvollen Instrument wird?
Den Vorschlag, die Tests unter Aufsicht durch Externe durchführen zu lassen, halte ich für schwer umsetzbar. Damit wären horrende Kosten verbunden. Ich denke, es wäre wichtig, erst einmal viel transparenter mit der Problematik umzugehen. Viele Schulen überschätzen ihr Leistungsniveau, weil ihnen gar nicht klar ist, dass die Aufgaben zu einfach sind für eine prognostische Aussage. Es wäre schon ein Fortschritt, wenn das IQB die Aufgaben für die VERA-Tests bundesweit vorgeben würde und die Zusammenstellung nicht den Ländern überlassen werden würde.

Zur Person

©Privat
  • Horst Weishaupt war von 1991 bis 2004 Professor für Empirische Bildungsforschung an der Pädagogischen Hochschule Erfurt/Mühlhausen (ab 2001 Universität Erfurt) und anschließend an der Bergischen Universität Wuppertal.
  • Von 2008 bis zu seiner Pensionierung 2013 leitete er am Deutschen Institut für Internationale Pädagogische Forschung (DIPF, jetzt: Leibniz-Institut für Bildungsforschung und Bildungsinformation) in Frankfurt am Main die Abteilung „Steuerung und Finanzierung des Bildungswesens“ (jetzt: Struktur und Steuerung des Bildungswesens).
  • Vorrangig befasst er sich mit Fragen der Schulentwicklung, Bildungsplanung und des Bildungsmonitorings.