Profile cover photo
Profile photo
Methodenlehre Uni Mainz
83 followers -
Methodenlehre, Statistik und Evaluation
Methodenlehre, Statistik und Evaluation

83 followers
About
Methodenlehre Uni Mainz's posts

Post has attachment
Combinatorics in +Blindspot vol. 2

Ok, it's time to come back to the remaining problem I decided not to cover here: https://plus.google.com/b/104655503559564193969/+Methodenlehren/posts/Eup1zBeihA5.

The question was how many permutations of 19 given letters had to be checked in alphabetical order until the target term

A S H W E L L C R E E K K E N N E L S

pops up?

Just as the agents in Blindspot, we have luck firmly on our side here. The leading letter of the target term is "A", and "A" also happens to be the first letter we would have checked when going through all possible permutations in alphabetical order. So we can dismiss this first letter and proceed only with a reduced set of 18 letters.

The question remains the same. How many permutation must we generate in alphabetical order until we reach the reduced target sequence which reads:

S H W E L L C R E E K K E N N E L S

Like before, we first sort the letters in alphabetical order to make things more, well, orderly.

C E E E E E H K K L L L N N R S S W

For starters, we shall again assume that all these letters are different. It is immediately clear that among the permutations we would traverse in alphabetical order, none can start with the letter "W" since it comes after "S". For the first letter, we therefore have 17 candidates in our set of letters ("C" through "S"). Good. The second letter of the target word is "H". "H" is the 7th letter in our set. So for the second letter, we have 7 candidates. Having worked out the logic by now, we may rinse and repeat down to the last letter.

But wait, there is another catch. The last letter in the target word is "S" again, Only that for the last letter we do not have 17 candidates left but merely one. Hence, for each position in the target sequence we have either as many candidates as there are letters alphabetically before the letter in question, or as many as there are left - whichever number is lower.

This gives us the following candidates for each of the letter positions:

1st letter (must be "S" or below): 17 candidates
2nd letter (must be "H" or below): 7 candidates
3rd letter (must be "W" or below): 18 candidates, but only 16 left
4th letter (must be "E" or below): 6 candidates
5th letter (must be "L" or below): 12 candidates
6th letter (must be "L" or below): 12 candidates
7th letter (must be "C" or below): 1 candidate
8th letter (must be "R" or below): 15 candidates, but only 11 left
9th letter (must be "E" or below): 6 candidates
10th letter (must be "E" or below): 6 candidates
11th letter (must be "K" or below): 9 candidates, but only 8 left
12th letter (must be "K" or below): 9 candidates, but only 7 left
13th letter (must be "E" or below): 6 candidates
14th letter (must be "N" or below): 14 candidates, but only 5 left
15th letter (must be "N" or below): 14 candidates, but only 4 left
16th letter (must be "E" or below): 6 candidates, but only 3 left
17th letter (must be "L" or below): 12 candidates, but only 2 left
17th letter (must be "S" or below): 17 candidates, but only 1 left

Can we multiply all of these quantities to compute the total number of permutations which will come up before our target word? Nope, we're still not quite there because if we did simply multiply, we would include duplicates.

We stumbled across this fact in the first post when we realized that many of the letters appear multiple times in the sequence. These multiple instances are indistinguishable from each other. Our final step therefore is to divide the product of all above quantities by (5! * 2! * 3! * 2! * 2!).

Phew. We now have:

17 * 7 * 16 * 6 * 12 * 12 * 1 * 11 * 6 * 6 * 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 / (5! * 2! * 3! * 2! * 2!) = 4,560,095,232

That's much, much less than before. Our hypothetical high-performance cluster would blow through these in about 5 hours. Nicely done!


I find this result pretty amazing, so I double-checked it for correctness. Twice. Why is the reduction to about 4.5 billion permutations so baffling to me?

Well, as a very coarse estimation we could state that by only checking the permutations beginning with "A" we eliminate 18 of the 19 potential first letters. This should lead to a 19-fold reduction of the number of permutations to search through. In reality, we find a 4631.25-fold reduction. Limiting the number of candidates per position has a massive effect on the remaining number of permutations which at least I would not have forseen. Combinatorics sometimes is not the most intuitive thing.

Nachlese der Lehrevaluation zur Statistik

Wie in jedem Semester haben wir auch im vergangenen Winter die Veranstaltung zur Statistik mit einer Lehrveranstaltungsevaluation abgeschlossen. Die Ergebnisse der numerischen Antworten sind traditionsgemäß auf unserer Website veröffentlicht (https://methodenlehre.sowi.uni-mainz.de/methods/index.php/dr-malte-persike/73-lehrevaluationen/692-ergebnisse-der-lehrevaluation-im-sose-2017). Noch einmal danke an alle Studierenden, die teilgenommen haben und ein ganz besonderes Dankeschön an jene, die sich die Mühe gemacht haben, auch noch den einen oder anderen freien Kommentar zu formulieren.

Die Bewertung der Veranstaltung durch unsere Studierenden war im vergangenen Semester ungewöhnlich gut und lässt kaum echte Rückschlüsse auf Veränderungspotential zu. Deshalb sind für mich die freien Antworten oftmals eine weitaus interessantere Quelle für Anregungen und vor allem Kritik an der Veranstaltung. Lasst uns deshalb kurz auf jene Kommentare schauen, die mehrfach genannt worden sind. Ich spare die positiven Kommentare dabei weitgehend aus, gelobt wird schon genug.

Kritik 1: Die Klausur
Ja, die Klausur. Sie ist auch für mich ein konstantes Ärgernis. Es gibt kaum einen Punkt, bei dem ich stärker mit unseren Studierenden übereinstimme als in Sachen Klausur. Die Kritik vieler Studierender an der Klausur wird in einem der Kommentare präzise auf den Punkt gebracht: "Zeitdruck in der Klausur!" Um zu verstehen, wie groß die Belastung ist, genügt ein Blick zurück in den Diplomstudiengang. Damals bestand Methodenlehre in den ersten beiden Semestern aus genau zwei Veranstaltungen: Statistik I und Statistik II. Zu jeder dieser beiden Veranstaltungen gab es eine separate Klasur von jeweils 120 Minuten Dauer. Im Diplom also wurden zwei Teilbereiche in 240 Minuten geprüft. Im Bachelor nun setzt sich das Modul Methodenlehre aus vier Veranstaltungen zusammen: Statistik I, Statistik II, Forschungsmethoden und dem Softwareseminar. Zu diesen vier Teilen gibt es eine Klausur mit 120 Minuten Länge. Das ist eine Vervierfachung der Stoffmenge pro Klausurminute.

Ich hätte das gerne anders. Meine Studierenden hätten das gerne anders. Es geht aber nicht anders. Warum nicht? Die Verantwortung für die klare Verschlechterung der Studierbarkeit vom Diplom zum Bachelor liegt bei den Studierenden. Das klingt kontrovers, deshalb ein Rückblick. Nachdem die ersten psychologischen Studiengänge im Rahmen der Bologna-Reform auf das Bachelor-/Master-System umgestellt worden waren, gab es massive Studierendenproteste. Vorlesungen wurden boykottiert, Hörsäle bestreikt, die Präsidialbüros besetzt. Die Studierendenverbände hatten seinerzeit die Gelegenheit, ihre in weiten Teilen berechtigten Widerstände gegen das neue Studiensystem in Form von Forderungskatalogen zu verschriftlichen. Besonders eine Forderung war damals Teil praktisch jeden Verbesserungsvorschlags: Weniger Klausuren! Für Lehrende hätte es nicht besser kommen können. Seltener prüfen, weniger Zeit in Klausurräumen verbringen, kürzere Klausurkorrekturen. Ein Paradies. Weil die Studierenden kaum etwas vehementer gefordert haben als weniger Klausuren und dieser Wunsch auch Lehrenden ein glückseliges Schimmern in die Augen legt, ist die Anzahl der Klausuren pro Semester heute einer der fundamentalen Pfeiler jeder Studiengangsakkreditierung. Für jede Klausur mehr müssen wir kämpfen, weniger Klausuren indes gehen nahezu problemlos durch. Dass allerdings mit weniger Klausuren die Stoffmenge nicht abnimmt, fällt dabei weitgehend unter den Tisch.

So kommt es zu der grotesken Situation, dass wir die Inhalte einer Vorlesung, für die wir im Diplom zwei Stunden Klausurzeit veranschlagen konnten, im Bachlor-Studiengang innerhalb von 30 Minuten abprüfen müssen. Für die Studierenden verbessert sich dadurch exakt nichts. Sie müssen weiterhin die Inhalte einer kompletten Vorlesung vorbereiten, nur werden diese Inhalte jetzt in wesentlich weniger Zeit abgeprüft. Die studentische Vorbereitungszeit dürfte sich also um keine einzige Minute reduzieren. Nicht nur verbessert sich für sie nichts, vieles wird sogar schlechter. Die kürzere Klausurzeit führt ein Moment der Beliebigkeit ein, denn es können weniger Inhalte abgeprüft werden. Damit schlagen Wissenslücken, Flüchtigkeitsfehler und Konzentrationslöcher wesentlich stärker ins Gewicht. Zudem sind wir gezwungen, eine so genannte "Speed-Klausur" schreiben zu lassen, bei der es stärker auf Geschwindigkeit ankommt und weniger auf die Wissenstiefe. Es wäre verheerend, wenn wir in einem 30minütigen Klausurteil eine "Power-Aufgabe" stellen würden, bei der ein Teil der Studierenden die richtige Lösung findet und ein anderer Teil vollständig scheitert. Wir können also gar nicht anders als die Klausur auf Geschwindigkeit anzulegen und gleichzeitig möglichst gut zu versuchen, durch moderate Variationen in den Aufgabenschwierigkeiten eine hinreichende Differenzierung zwischen den Studierenden hinzubekommen.


Kritik 2: Das Veranstaltungsformat passt nicht
Eine kleinere Gruppe von Studierenden kritisiert unser Blended Learning Szenario und dabei vor allem die Videos. Das ist nicht weniger als eine Fundamentalkritik und schlägt sich in zwei der abgegebenen Kommentare nieder: "Leider entspricht die Art der Lehre (Videos und co.) nicht meinem Lernstil." und ein wenig pointierter "ich bin kein Baby, das Kinderkanal schauen möchte". Es ist wohl davon auszugehen, dass sich diese beiden Studierenden eher eine klassische Präsenzvorlesung gewünscht hätten. Die zugrunde liegende Frage ist jene der Diversität. Eine optimale Lehrveranstaltung sollte jedem Studierenden die Möglichkeit personalisierten Lernens mit individualisierten Lernwegen und Lernmethoden geben. Studierende, die nach einer traditionellen Vorlesung dürsten, könnten diese in einer auf Diversität ausgelegten Lehrveranstaltung bekommen, andere würden mit Buchkapiteln versorgt, wieder andere mit Lernvideos. Sollte man machen. Kann man aber nicht. Die begrenzten Ressourcen, mit denen Hochschullehre - wie auch jede andere Lehre - immer konfrontiert ist, lassen eine so starke Ausdifferenzierung nicht zu.

Deshalb haben wir eine Entscheidung getroffen: die Entscheidung für den Inverted Classroom. Es gibt überwältigende Evidenz aus der Forschung und auch aus unseren eigenen Erhebungen, dass der Inverted Classroom für den größten Teil unserer Studierenden weit besser funktioniert als die traditionelle Vorlesung. Lernmotivation, Lernfreude und Lerngewinn sind durch die Bank höher als im klassischen Setting. Mir ist aber schmerzlich bewusst, dass es eine sehr kleine Gruppe von Studierenden gibt, der wir mit dem Inverted Classroom keinen Gefallen tun.


Kritik 3: Stoffmenge, Anforderungsniveau und Geschwindigkeit sind zu hoch
Einige Studierende kritisieren die erhebliche Stoffmenge, deren zu hohe Vermittlungsgeschwindigkeit, das Anforderungsniveau oder alle drei zusammen. Diese Probleme schlagen sich in Antworten nieder wie "Zum Teil zu schnelles Vorgehen", "Teilweise waren die Tutoriumsaufgaben zu lang, um sie im Tutorium gemeinsam lösen zu können", "Die Wochenaufgaben und Videos sind sehr umfangreich, nehmen somit sehr viel Zeit in Anspruch" oder "Das Niveau der Vorlesung (also der eigentlichen Veranstaltung) ist mir oft etwas zu hoch, was mich vor allem im ersten Semester oft verunsichert hat.". Wir wissen, dass die Statistik im Psychologiestudium zu den größten Herausforderungen für viele Studierende zählt. Gleichzeitig aber sehen wir seit der Einführung des Inverted Classroom Formats eine mehr als deutliche Verringerung dieser Kritik. Bei den gerade zitierten vier Kommentare handelt es sich tatsächlich um die Gesamtheit aller Anmerkungen in dieser Richtung. In der klassischen Präsenzvorlesung war das deutlich mehr.

Ich habe gerade noch einmal gezählt, wie viele Kommentare vergleichbarer Art in der Evaluation zur letzten Präsenzvorlesung aus dem Jahr 2012 enthalten waren. Der Vergleich ist eindeutig: in der aktuellen Evaluation wird das zu hohe Anforderungsniveau von 4 der 121 Studierenden genannt (3%), im Jahr 2012 waren es 29 der 113 Studierenden (22%). Das ist eine Veränderung von mehr als 700%. Trotzdem nehmen wir diese Kritik sehr ernst und versuchen deshalb, die Supportstrukturen noch weiter zu verbessern - bessere Übungsaufgaben, mehr Materialien, Lösungsvideos, eine erheblich veränderte Präsenzphase. Die Möglichkeiten sind sicher noch nicht ausgeschöpft. Gleichzeitig aber muss ich darauf hinweisen, dass für eine Veranstaltung mit 6 ECTS Punkten 180 Arbeitsstunden pro Semester veranschlagt werden. Das sind knapp 13 Stunden/Woche in den durchschnittlich 14 Semesterwochen. Dabei handelt es sich nicht um eine willkürliche Vorgabe von mir, sondern um die Leitlinien aus der Bologna-Reform. Ich meine es deshalb vollkommen ernst, wenn ich meine Studierenden bereits in der Einführungsveranstaltung darum bitte, mich oder meine Tutoren anzusprechen, wenn der eigene wöchentliche Arbeitsaufwand oberhalb von 13 Stunden pro Woche liegt. Nur wenn wir durch individuelle Rückmeldung herausbekommen, wo der Knoten sitzt, können wir die Betreuung noch besser machen.

Kritik 4: Videos zu lang
Manche Studierende merken an, dass die Videos zu lang und teilweise zu ausführlich sind. Das schlägt sich in Kommentaren nieder wie "Manchmal hätte man das ein oder andere Video etwas kürzer halten können. Diese waren dann seeehhhrrr ausführlich." oder "Die Videos sind teilweise zu lange, und ein bisschen zu ausführlich bzw. behandeln zu lange das Theoretische und nicht das Praktische [...]". Ich stimme vollkommen zu. Für eine Reihe unserer Studierenden sind die Videos vermutlich zu langatmig und zu detailliert. Das ist die Crux der Normalverteilung von Fähigkeit. Jedes nicht-adaptive Medium wird für den einen Studierenden zu lang oder zu trivial und für den anderen zu knapp oder zu anspruchsvoll sein. Erneut gilt, dass wir mit mehr Ressourcen natürlich in der Lage wären, besser individualisierbare Materialien zu produzieren. Aktuell aber müssen wir wenigstens beim Inhalt der Videos mit einer "One-Size-Fits-All" Lösung leben. Dass die Videos mit weitem Abstand sehr viel häufiger bei den positiven Kommentaren auftauchen, ist ein Indiz dafür, dass unser der Spagat zwischen "zu knapp" und "zu lang" einigermaßen gut gelungen ist.

Kritik 5: Inhalte redundant
Kein Kritikpunkt wird von mehr Studierenden benannt als dieser. "Ziemlich viel Überscheidung zu Beginn der Veranstaltung" und "Leider war der Beginn der Veranstaltung recht redundant mit vielem des ersten Semesters" sind nur zwei einer ganzen Reihe gleichlautender Kommentare. Die Kritik bezieht sich vor allem auf die ersten vier Wochen des Semesters. Hier werden unsere Zweitsemester mit Inhalten konfrontiert, die sie aus dem Vorsemester bereits kennen. Diese Redundanz können wir nicht auflösen, da in Mainz der Beginn des Psychologiestudiums sowohl zum Sommer- als auch zum Wintersemester möglich ist. Wir müssen für jede Kohorte gleichwertige Studierbarkeit garantieren, was gerade in der Statistik die Doppelung von Inhalten absolut unvermeidbar macht. Wir nehmen für uns die Aufgabe mit, auf diese Redundanz noch besser hinzuweisen und den Zweitsemestern so eine bessere Allokation ihrer Lernzeit zu ermöglichen.


Schöne Semesterferien!

Post has attachment
Geschichte einer Bachelor Katastrophe

Vor ein paar Tagen gab es von mir diesen Tweet https://twitter.com/methodenlehre/status/839035770803478528 mit der unten angehängten Grafik. Darauf habe ich eine ganze Reihe von Rückmeldungen bekommen. Die Reaktionen reichten von "Versagen der Digitalisierung!!!" bis hin zu "Bei Euch würde ich liebend gerne studieren."

Kurz zur Erklärung. Die Grafik zeigt den Notenspiegel meiner letzten Abschlussklausur im Modul Methodenlehre. Darin versteckt sind zwei Botschaften. Eine davon spricht vehement für den Inverted Classroom, während die andere mindestens ebenso vehement auf ein Problem vieler Bachelorstudiengänge hinweist.


Sie werden besser!

Für die gute Nachricht braucht man - einen Finger. Mit diesem verdeckt man den roten Balken der 16% gescheiterten Studierenden und schaut sich nur die verbleibenden grünen Balken an. Man sieht, dass der Klausurausfall für eine Veranstaltung wie Statistik im Psychologiestudium richtig, richtig gut ist. Es gibt kaum Studierende mit einer Note ohne Zwei vor dem Komma. Die Verteilung der Noten ist klar linkssteil, mehr als ein Drittel der Studierenden erreicht eine Eins vor dem Komma.

Ich möchte behaupten, meine Veranstaltungen zur Statistik warten mit einer ungewöhnlich hohen Stoffdichte und durchaus anspruchsvollen Inhalten auf. Zudem arbeiten die Studierenden aktiv mit Excel und lösen auch die Klausur darin. Alles bisherigen Klausuren stehen online zur Verfügung (http://methodenlehre.org), so dass sich der geneigte Leser selbst vom gehobenen Niveau der Veranstaltung überzeugen kann.

Dass sich in einer solchen Veranstaltung ein derart guter Notenspiegel ergibt, ist herausragend - ein dickes Kompliment an meine Studierenden! Gleichzeitig hoffe ich, dass ein nicht geringer Anteil davon auf das Blended Learning Format zurückgeht, in dem ich die Veranstaltung halte.


Sie werden schlechter.

All das gilt wie gesagt nur dann, wenn man einen Finger benutzt, um den roten Balken verschwinden zu lassen. Es lohnt sich deshalb, den Finger wieder anzuheben und etwas näher auf die 16% der nicht bestandenen Klausuren zu schauen. Sind das alles Opfer des Blended Learning, vom Inverted Classroom? Es gibt belastbare Hinweise darauf, dass eine kleine Gruppe von Studierenden mit dem Format nicht zurechtkommt und abgehängt wird. Wir haben das in unseren Verstanstaltungen zahlenmäßig untersucht und auch mein Kollege Prof. Jürgen Handke (http://linguistics.online.uni-marburg.de/) berichtet regelmäßig davon: Im Inverted Classroom profitiert eine große Menge von Studierenden so sehr, dass ihre Leistungen merkbar steigen und Klausuren besser werden. Eine kleine Gruppe allerdings wird durch den Inverted Classroom abgehängt.

So erklärt sich die nahezu vollständige Ausdünnung im unteren Bestehensbereich. Die Gruppe der leistungsschwächeren Studierenden differenziert sich dramatisch. Ein größerer Teil von ihnen profitiert deutlich vom Inverted Classroom und steigt in den guten Notenbereich auf, der andere Teil aber bricht weg. Er bricht sogar so deutlich weg, dass von den 16% der Studierenden, die nicht bestanden haben, nur eine einzige Person die Bestehensgrenze um weniger als 12 Prozentpunkte verfehlt hat. Alle übrigen haben weniger als 38% der erreichbaren Punkte erzielt.


Die Bachelor-Katastrophe

Genau bei diesem Teil der Studierenden, die mit der Bestehensgrenze kämpfen, schlägt eine katastrophale Entscheidung bei der Gestaltung unsere Bachelor-Studiengangs durch. Es geht um den kompletten Wegfall von Binnenabhängigkeiten. Was ist das?

Unter einer Binnenabhängigkeit verstand man in den traditionellen Diplom-Studiengängen solche Studiumsleistungen, die erbracht werden mussten, damit spätere Studiumsleistungen überhaupt erbracht werden durften. Ein Beispiel: In den meisten Diplomstudiengängen Psychologie war der Besuch des so genannten Experimentellen Praktikums im 3./4. Semester an das Bestehen der Statistikprüfung geknüpft. Eine Anmeldung zum "ExPra" konnte nur stattfinden, wenn zuvor die Statistikprüfung bestanden wurde. Das war aus inhaltlicher Sicht eine absolut sinnvolle Maßgabe, denn in kaum einer Veranstaltung im Psychologiestudium wird mehr Statistik benötigt als während des ExPra - immerhin geht es dort um Forschung und ihre Ergebnisse.

Es war gleichzeitig auch aus aus Gründen der Studierbarkeit eine enorm wichtige Hürde. Sie hat Studierende recht früh im Studium mit den Ansprüchen eines empirisch fundierten Studienfachs konfrontiert. Sie hat Studierende dazu gebracht, recht früh über die Passung ihrer eigenen Vorstellungen und Kompetenzen mit dem Wissenschaftsanspruch der Psychologie nachzudenken.

Diese Hürde ist in den Bachelorstudiengängen weggefallen. Das ist eine Katastrophe. Schauen wir noch einmal auf die 16%. Ein großer Teil von ihnen zeichnet sich durch eine Studiendauer von mehr als 5 Semestern aus. Ich kenne aus persönlichen Gesprächen mindestens drei Studierende, die alle oder fast alle übrigen Studienleistungen bereits absolviert haben. Sie haben durchstudiert, sie sind fertig mit ihrem Studium. Bis auf eine einzige Studienleistung aus dem zweiten Semester! Man führe sich die Vernichtung von Lebenszeit vor Augen, die mit einem Scheitern dieser Studierenden verbunden wäre. Die Ressourcen, die verbrannt wurden. Das ist eine Katastrophe. Eine persönliche Katastrophe für jeden einzelnen dieser Studierenden. Und eine systemische Katastrophe.

Deregulierung ist zuweilen nicht förderlich. Genau an dieser Stelle ist sie sogar schädlich. Wir brauchen Binnenabhängigkeiten im Bachelorstudium Psychologie!

Post has attachment
Vom Unsinn der Drittelnote 2.0

Vor etwa fünf Jahren habe ich einen etwas längeren Text über die Probleme mit dem in den Bologna Studiengängen üblichen System der Drittelnoten geschrieben (https://plus.google.com/u/1/b/104655503559564193969/+Methodenlehren/posts/Rw1bzQ53232).

Mein Urteil war seinerzeit eindeutig. Drittelnoten sind sowohl aus mathematischer als auch psychologischer Sicht nicht sinnvoll. Zur Erinnerung, mit Drittelnoten wird dieses System zur Notenskalierung bezeichnet:

1.0 und 1.3 (sehr gut)
1.7, 2.0 und 2.3 (gut)
2.7, 3.0 und 3.3 (befriedigend)
3.7 und 4.0 (ausreichend)
5.0 (nicht bestanden)


Heute gibt ein kleines Update dazu. Nein, wir haben uns noch nicht von der Drittelnote verabschiedet, ganz im Gegenteil. Es erging vor kurzem eine Anfrage an mich zur korrekten Umwandlung von Klausurpunkten in Drittelnoten. "Korrekt" heißt in diesem Zusammenhang "fair" und deshalb lautet die Frage in ihrer einfachsten Form:

Wie lassen sich erreichte Klausurpunkte fair in Drittelnoten umwandeln, so dass die ungleichen Abstände zwischen Drittelnoten berücksichtigt werden?


Die meisten Prüfungsordnungen in Deutschland sehen vor, dass bei Klausuren, deren Ergebnis eine bestimmte Punktzahl ist, ein Prüfling mindestens 50% der maximal erreichbaren Punkte erzielt haben muss, um zu bestehen. Die verbleibenden 50% der Punkte werden dann auf die Drittelnoten von 4,0 bis 1,0 aufgeteilt. Die Prüfungsordnungen definieren meistens aber nicht weiter, wie diese Aufteilung konkret erfolgen soll.

Das Fehlen einer Vorschrift ist heikel, weil man sich für die Aufteilung mindestens drei mathematisch vernünftige Methoden überlegen kann. Keine dieser Methoden hat offensichtliche Vor- oder Nachteile und alle lassen sich plausibel begründen.

Ich habe diese drei Methoden nun zunächst formal aufgeschrieben. Dann habe ich die „Fairness“ dieser Methoden mathematisch bewertet – ich nenne es „Validität“, um den zuweilen etwas problematisch konnotierten Begriff der Fairness zu vermeiden.

Das entsprechende Dokument gibt es zum Download als Excel-Datei (https://www.dropbox.com/s/r8avjfglim6t8e5/Drittelnoten.xlsx?dl=1) oder als PDF-Datei (https://www.dropbox.com/s/e1l8d86v8wy06q7/Drittelnoten.pdf?dl=1).

Es ergibt sich, dass eine der drei Methoden eindeutig unfairer ist als die übrigen beiden. Unfair in dem Sinne, dass die tatsächlich vergebene Note am weitesten von jener Note abweicht, die die Studierenden eigentlich hätten erhalten müssen.

Ich kann deshalb nur dringend empfehlen, sich mit der Drittelnotenvergabe in Klausuren näher auseinanderzusetzen.

*Combinatorics in +Blindspot *

Just watched S01E09 of +NBC's Blindspot which contained a nice combinatorics puzzle. Let's have a look at it.

The premise was that 19 letters were found which could be arranged in any order. In their correct and, of course, momentously relevant order, the letters were

A S H W E L L C R E E K K E N N E L S

One of the series' characters claimed that they tried every possible combination of those 19 letters. I was wondering how may combinations we are talking about. Well, combinatorics to the rescue!

The problem looks rather simple at first. It boils down to permutations with groups.

First, we may sort the letters alphabetically:

A C E E E E E H K K L L L N N R S S W

Now, as a start we assume that all 19 letters were different. Combinatorics tells us that there are

19 * 18 * 17 * 16 * 15 * ... * 2 * 1 = 19!

permutations of these 19 letters. This is a fairly large number but it reduces by quite a bit when we consider that not all letters are actually different. There are

5 x "E"
2 x "K"
3 x "L"
2 x "N"
2 x "S"

So, for each and every of the 19! permutations we could swap the "E"s around and nothing would change. Same for the "K"s, the "L"s and so forth. Put short, we have duplicates. How many would that be? The answer again involves factorials. In terms of how many permutations there are for arranging the groups of identical letters, we have

5! for the "E"
2! for the "K"
3! for the "L"
2! for the "N"
2! for the "S"

We thus need to divide our 19! by (5! * 2! * 3! * 2! * 2!) which gives us

19! / (5! * 2! * 3! * 2! * 2!) = 21,118,941,043,200

possible permutations of the 19 letters. In US metrics, this amounts to twenty-one trillion, one hundred eighteen billion, nine hundred forty-one million, forty-three thousand, and two hundred possible combinations in which the 19 letters could be arranged.

In EU metrics, this would be twenty-one billion, one hundred eighteen milliards, nine hundred forty-one million, forty-three thousand, and two hundred possible combinations.


How long would it take for all those permutations to be processed? As of today, #Google handles about 60,000 requests per second and it is likely that Google has at least a 300% capacity buffer. So let's say a a high-performance distributed network could process 240,000 requests per second. Traversing over all combinations would then take

21,118,941,043,200 / 240,000 / 86,400 = 1018.46745 days

or about 2.79 years to complete. That's quite a long while. But wait, here's where things get tricky. Suppose the software was programmed such that all combinations were checked in alphabetical order, how many combinations would need to be probed until the ultimately successful combination

A S H W E L L C R E E K K E N N E L S

would be reached? This is a more challenging question - for another time! For now, we conclude that the maths consultants for Blindspot might not have strayed too far from a realistic account of modern technology.

Eine Frage aus der Kommentarbox kurz vor der Klausur

Frage: Ich frage mich warum wir 65% Varianzaufklärung manchmal als "hoch", manchmal als "mittel" bezeichnen. Nach Cohen ist doch
r²<0,8 mittlere Varianz.

Antwort: Streng genommen völlig richtig. Aber die Cohen-Regeln sind Faustregeln und deshalb gerade nicht streng zu nehmen. Für die „weicheren“ Disziplinen in den Sozialwissenschaften - also praktisch alle außer die experimentelle Forschung - sind 50-60% Varianzaufklärung oft schon gigantisch, höhere Werte kaum zu erreichen. Deshalb bezeichnen wir Werte oberhalb von 60-70% oft auch schon mit „recht hoch“ oder „fast hoch“ oder „ziemlich hoch“.

Man macht aber sicher auch nichts falsch, sich streng an Cohen zu orientieren.

Quantile und Quantilsränge

Von unseren Studierenden werden wir immer wieder gefragt, worin genau der Unterschied zwischen dem Quantil und dem Quantilsrang besteht. Obwohl die formelhafte Definition der beiden eine eindeutige mathematische Antwort darauf liefert, braucht deren inhaltliches Verständnis manchmal einen "Heureka!"-Moment.

Deshalb erklären wir den Unterschied zwischen Quantil und Quantilsrang vollkommen ohne Formeln und mit starkem Inhaltsbezug.


(1) Quantil
Wir beginnen mit dem Quantil. Angenommen, wir haben die Anzahl der in einer Klausur erreichten Punkte bei n=100 Studierenden erhoben. Diese Punktleistung sei die Variable X.

Wir können uns zu diesen 100 Klausurleistungen Fragen stellen wie:

"Wie viele Punkte muss jemand haben, um zur besseren Hälfte der Studierenden zu gehören (der 50:50 Punkt)?"

"Wie viele Punkte muss jemand haben, um zu den besten 10% der Studierenden zu gehören (der 90:10 Punkt)?"

"Wie viele Punkte haben die schlechtesten 5% der Studierenden höchstens erzielt (der 5:95 Punkt)?"

Wir haben also irgendeine prozentuale Teilung der Stichprobe gegeben. In den Beispielen sind das 50% : 50%, 10% : 90% und 95%:5%. Wir fragen nach dem Wert der Variable X, also nach den erreichten Klausurpunkten, die die Stichprobe in diesen Prozentsätzen teilen. Dieser Wert der Variable X ist das Quantil.


(2) Quantilsrang
Der Quantilsrang befasst sich mit dem genauen Gegenteil. Wieder nehmen wir an, dass wir die Klausurpunktzahlen von n = 100 Studierenden erhoben haben.

Wir können zu diesen 100 Klausurleistungen auch Fragen stellen wie:

"Wie viel Prozent der Studierenden erreichen einen Wert von 51 Punkten oder mehr?"

"Wie viel Prozent haben einen Wert von 23 Punkten nicht überschritten?"

"Klaus hat einen Wert von 79 Punkten erzielt. Wie viel Prozent der Studierenden sind höchstens so gut wie Klaus?"

Wir haben in diesen Fällen irgendeinen Punktwert gegeben, also einen Wert der Variablen X. Im Beispiel sind das die Werte 51, 23 und 79. Wir fragen nun nach den prozentualen Anteilen, in die genau dieser Wert die Stichprobe teilt. Dieser Prozentwert ist der Quantilsrang.


Zusammenfassung
Die Unterscheidung zwischen Quantil und Quantilsrang ist also eigentlich ganz einfach.

(1) Quantil: Gegeben ist ein Prozentsatz und damit automatisch auch sein Gegenstück, in die die Stichprobe geteilt werden soll. Der Wert der Variablen X, der die Stichprobe genau in diese Prozentsätze teilt, ist das Quantil.

Also: Quantil = Prozentsatz rein, X-Wert raus. Der X-Wert ist das Quantil.

(2) Quantilsrang: Gegeben ist ein Wert einer Variablen X. Der Prozentwert und sein Gegenstück, in die die Stichprobe durch diesen X-Wert geteilt wird, ist der Quantilsrang.

Also: Quantilsrang = X-Wert rein, Prozentwert raus. Der Prozentwert ist der Quantilsrang.


Es sind nur Synonyme
Letzten Endes also sind "Quantil" und "Quantilsrang" nichts anderes als Synonyme. Es sind nur andere Bezeichnungen für etwas, das wir schon kennen. Quantile sind "X-Werte"; oder "Realisationen" von Variablen; oder "Messwerte". Quantilsränge sind "Prozentwerte"; oder "Teilungsverhältnisse". Jedes Quantil hat den dazu gehörigen Quantilsrang, denn jeder Messwert (das Quantil) teilt eine Stichprobe in einem bestimmten Verhältnis (der Quantilsrang).


A real-world example
Ein typisches Beispiel für den Quantilsrang sind übrigens die SAT-Scores an US-amerikanischen Universitäten. Die Studierenden erhalten als Ergebnis einer Leistungsprüfung keine Note oder eine erreichte Punktzahl, sondern einen Prozentsatz zwischen 0% und 100%. Ein solcher SAT-Score besagt, wie viele andere Prüfungsteilnehmer höchstens so gut waren wie der Kandidat selbst. Wenn also die Studentin Gillian einen SAT-Score von 98 erhält, weiß sie, dass sie 98% aller übrigen Studierenden hinter sich lässt und nur 2% noch besser waren als sie. Genau diese 98% sind ein Quantilsrang. Der Punktwert, den Gillian erzielt hat und aus dem die 98% ermittelt wurden, ist das Quantil.

Post has attachment
Herleitung der positiven und negativen Phi-max Formeln

Ich wurde gefragt, ob es eine Herleitung der Abkürzungsformeln für den positiven und negativen phi-max Koeffizienten gibt, die wir in der Vorlesung verwenden.

Natürlich gibt es eine solche Herleitung. Sie ist in der ersten Unit im Kapitel 8 unseres iversity-Kurses (https://iversity.org/courses/primer-deskriptive-statistik) verlinkt und ebenso findet man sie hier zum direkten Download: https://www.dropbox.com/s/lriw6sg10un9n49/Phimax_Herleitung.pdf?dl=1


Halbe Gruppe, kürzere Zeit? No way!

Endlich wird über Lehre diskutiert. Über die Kommentarbox ging eine Anfrage ein, die es in sich hat.

Frage: Könnte die Statistik VL freitags bitte wieder zweigeteilt werden? Ein Teil des zweiten Semesters fand die vorherige Gruppengröße deutlich angenehmer, da man sich besser auf die Aufgaben konzentrieren und deinen Ausführungen folgen konnte.

Antwort: In dieser Frage stecken so viele Ideen über Lehre, dass ich mit Freude darauf antworte. Um die Gefahr der Textwandproduktion zu minimieren, wird die Antwort auf sieben Kernaspekte heruntergebrochen.

1. Die gute alte Zeit
Bevor wir loslegen, eine kurze Rückblende. In der Zeit von WiSe 2013/2014 bis SoSe 2016 haben wir unsere Vorlesung zur Statistik zweigeteilt. Die Hälfte der Studierenden erschien zur ersten Stunde, die andere Hälfte zur zweiten Stunde. Jede Gruppe absolvierte dann eine nur 50minütige Übung, bevor die nächste Gruppe den Raum übernahm.

Der Hintergrund der Frage ist damit klar. Eine kleinere Gruppe wird als förderlich für das Verständnis der Inhalte wahrgenommen, auch wenn sich die Beschäftigungszeit mit diesen Inhalten fast halbiert. Stimmt das? Meine Antwort darauf lautet: Auf keinen Fall! Und weil wir Empiriker sind, darf das nicht nur eine persönliche Meinung sein, sondern Ergebnis evidenzbasierter Forschung. Lasst uns deshalb damit beginnen, was man über den Zusammenhang zwischen Gruppengröße und Lernerfolg weiß.

2. Kleines n = besseres n?
Die Gruppengröße im Klassenraum hat erhebliche Einflüsse auf die Lernförderlichkeit, daran bestehen kaum Zweifel (Thomas & Fink, 1963). In kleinen Gruppen wird mehr diskutiert (Caspi, Gorsky & Chajut, 2003), besser gelernt (Blatchford, Bassett, Goldstein & Martin, 2003) und mit weniger Störungen mehr verstanden (Ehrenberg, Brewer, Gamoran & Willms, 2001). Das Problem hier ist die Bedeutung von "klein". Im Kontext formaler Lehre wie an Schulen und Universitäten spricht man von kleinen Gruppen, wenn weniger als 25 Personen gemeinsam lernen. Oberhalb dieser quasi magischen Grenze allerdings tut sich nur noch sehr wenig. Ob in einem Hörsaal 50, 100 oder 150 Personen sitzen, spielt eine nur sehr untergeordnete Rolle für die Lernwirksamkeit. Mit solchen Gruppengrößen befindet man sich weit jenseits von "klein" und bewegt sich in Bereichen, wo sich die reine Zahl von Studierenden nicht mehr wesentlich auf die Lernleistung auswirkt.

Der einzige Effekt, der sich bei diesen größeren Auditorien konstant findet, ist der negative Einfluss von Störungen durch die höhere Lautstärke (Anderson, 2004). Solche Störungen aber haben wir in der Statistik in Mainz ziemlich gut im Griff. Die Lautstärke während der Stillarbeitsphasen (<50 dB) sowie der Wortmeldungen (ca. 60 dB) liegt im unteren Bereich des für Lehrveranstaltungen typischen Geräuschpegels (Tiesler & Oberdörster, 2006). Es gibt also keine belastbare Evidenz für die in der Frage aufgeworfene These, das Konzentrationsvermögen sei durch die schiere Gruppengröße negativ beeinflusst. Auch wollen mir keine Sekundäreffekte einfallen, die mit einer höheren Gruppengröße assoziiert wären und die im Verdacht stehen könnten, den Lernerfolg systematisch zu mindern.

Lasst uns deshalb auf die andere Seite schauen, nämlich warum ich die Zusammenlegung der Gruppen für eine sinnvolle Idee halte.

3. Zeitmanagement für Beginner
Zunächst einmal fällt der Blick hier auf die reine Lerndauer. In den 50minütigen Gruppen blieb oft keine Zeit, um die gesamten Inhalte der zugrunde gelegten Videos hinreichend gut abzudecken. Beispielanalysen konnte nicht zuende geführt werden, für Fragen der Studierenden blieb nur wenig Zeit und eine vertiefte Betrachtung unserer Übungsbeispiele war nicht selten nur eingeschränkt möglich. Die Zeitknappheit hat sich durch unseren Einsatz von Pingo als Audience Response System noch verstärkt. Für das Stellen von 4-5 Pingo-Fragen mitsamt der anschließenden kurzen Besprechnung einzelner Antwortalternativen vergehen gerne einmal 20 Minuten oder mehr. Das nimmt vom ohnehin schon knappen Zeitkontingent in geteilten Gruppen noch einmal so viel von der Uhr, dass eine lernförderliche Übung absolut unmöglich wird.

4. Warum unbedingt Pingo?
Jetzt kann man erwägen, dass man den Pingo-Quatsch ja auch lassen könnte. Um diesen Einwand in der Diktion des gewählten Präsidenten der Vereinigten Staaten zu beantworten: Wrong!

Audience Response Systeme sind eines der ganz, ganz wenigen Lernformate, bei deren Bewertung sich die empirische Forschung einig ist. Ihr Einsatz hat ausschließlich positive Effekte auf den Lernerfolg von Studierenden. In Präsenzlehreinheiten sind zu jeder gegebenen Zeit nicht selten mehr als die Hälfte aller Anwesenden mental abgelenkt (Szpunar, Moulton & Schacter, 2013). Diesem Problem begegnen Audience Response Systeme, die das simultane Beantworten von Fragen durch alle Teilnehmenden einer Lehrveranstaltung ermöglichen. Audience Response Systeme erhöhen die Teilnahmebereitschaft, Aufmerksamkeit und Engagement der Studierenden und führen wenigstens kurzfristig zu besserer Lernleistung (Kay & LeSage, 2009), mithin auch zu erhöhtem fachbezogenen Selbstvertrauen (Nelson, Hartling, Campbell & Oswald, 2012). So ist es nicht verwunderlich, dass aktive und passive Studierende gleichermaßen positive Einstellungen zu Audience Response Systemen in der Lehre haben, insbesondere, wenn deren Einsatz freiwillig und ohne Benotung stattfindet (Graham, Tripp, Seawright & Joeckel, 2007). Für Lehrende ist lediglich zu beachten, dass Audience Response Systeme gegebenenfalls eine gründliche Einarbeitung in die Technik wie auch in Aspekte der Fragenkonstruktion erfordern. Insgesamt dürfen Audience Response Systeme als gut beforscht gelten, mit nahezu ausschließlich positiven Resultaten. Zudem sind sie eines der wenigen Instrumente für die Präsenzphase, das problemlos auf beliebige Gruppengrößen skaliert werden kann – von der Übung mit wenigen dutzend Teilnehmern bis zur Großvorlesung mit hunderten Anwesenden. Deshalb nutzen wir Pingo (http://trypingo.com/) und dafür brauchen wir mehr Zeit.


5. Nebeneinander denken oder miteinander arbeiten
Zudem erlaubt uns die Verlängerung der Veranstaltungszeit durch die Zusammenlegung der Gruppen, dass wir Lernszenarien einsetzen können, bei denen die Studierenden durch intensive Überlegung und kollaboratives Arbeiten ihr Verständnis optimal festigen und vertiefen. In der zusammengelegten Gruppen üben wir nicht mehr nur nebeneinander her, sondern arbeiten miteinander. Durch solche Phasen gemeinsamer Beschäftigung wird eine deutlich höhere Aktivierung der Studierenden erreicht und mentaler Absentismus während des Präsenzunterrichts reduziert (Kothiyal, Majumdar, Murthy & Iyer, 2013). Auch zeigt sich, dass Lernende durch die durch die Ko-Konstruktion von Wissen signifikant bessere Lernleistungen erzielen als in der klassischen Präsenzlehre (Baleghizadeh, 2010). Wenn also auf Seiten der Lernenden die Bereitschaft zum kooperativen Arbeiten besteht, sind solche Arbeitsphasen in hohem Maße lernwirksam (Storch, 2007).


6. Fair geht vor
In den vergangenen Semestern ist mir zusehends aufgefallen, dass die Aufteilung meiner Studierenden in zwei Gruppen dem Fairnessgedanken fundamental entgegensteht. Es ist regelmäßig vorgekommen, dass Dinge, die in einer Gruppen besprochen wurden, in der anderen Gruppe unter den Tisch gefallen sind, oder dass Erklärungen in der zweiten Runde einfach besser auf den Punkt formuliert waren. Das schafft Ungleichheit bei Wissen und Kompetenzen, mit denen ich nicht einverstanden bin. Gerade dann, wenn Studierende in ihrer Kompetenzentwicklung auch durch den Input der Anderen profitieren (Krause, Stark & Mandl, 2009), so wie es in unserer Veranstaltungsform explizit angelegt ist, kann also eine Gruppenteilung hochgradig unerwünschte Effekte haben.


7. Mehr Leute, mehr Fragen, mehr Antworten
Schließlich bleibt uns in der von 50 auf 90 Minuten verlängerten Zeit sehr viel mehr Raum für Fragen und Antworten. Ich kann Übungen mit mehr Tiefe vorstellen, mehr Probleme aufwerfen, mehr Lösungen entwickeln und natürlich auch mehr Fragen meiner Studis moderieren. Das ist gerade bei unsererm digital gestützten Blended Learning Format von enormer Bedeutung (Lim & Morris, 2009).

Übrigens, wir haben erfreut festgestellt, dass sich auch die Anwesenheitszahlen mit der Zusammenlegung erhöht haben. Während in den geteilten Gruppen zumeist insgesamt etwa 70-80 Studierende die Übung besucht haben, sind es in diesem Semester konstant über 90 Personen. Und wenn wir in der Hochschuldidaktik eines wissen, dann dass es kaum einen besseren Prädiktor für Klausurerfolg gibt als die Anwesenheit (Credé, Roch & Kieszczynka, 2010).

Deshalb: eine Teilung der Gruppen kommt auf keinen Fall in Betracht. Sehr greifbaren und gut belegten Vorteilen stehen allein anekdotische Vorbehalte entgegen. Für uns Empiriker ist die Entscheidung damit glasklar.


Literatur zum Nachlesen
Anderson, K. (2004, May). The problem of classroom acoustics: The typical classroom soundscape is a barrier to learning. In Seminars in Hearing (Vol. 25, No. 02, pp. 117-129). Copyright© 2004 by Thieme Medical Publishers, Inc., 333 Seventh Avenue, New York, NY 10001, USA.

Baleghizadeh, S. (2010). The effect of pair work on a word-building task. ELT Journal, 64(4), 405-413.

Blatchford, P., Bassett, P., Goldstein, H., & Martin, C. (2003). Are class size differences related to pupils' educational progress and classroom processes? findings from the institute of education class size study of children aged 5–7 years. British Educational Research Journal, 29(5), 709-730.

Caspi, A., Gorsky, P., & Chajut, E. (2003). The influence of group size on nonmandatory asynchronous instructional discussion groups. The Internet and Higher Education, 6(3), 227-240.

Credé, M., Roch, S.G. & Kieszczynka, U.M. (2010). Class attendance in college: A meta-analytic review of the relationship of class attendance with grades and student characteristics. Review of Educational Research, 80(2), 272–295.

Ehrenberg, R. G., Brewer, D. J., Gamoran, A., & Willms, J. D. (2001). Class size and student achievement. Psychological Science in the Public Interest, 2(1), 1-30.

Graham, C. R., Tripp, T. R., Seawright, L., & Joeckel, G. (2007). Empowering or compelling reluctant participators using audience response systems. Active Learning in Higher Education, 8(3), 233-258.

Kay, R. H., & LeSage, A. (2009). Examining the benefits and challenges of using audience response systems: A review of the literature. Computers & Education, 53(3), 819-827.

Kothiyal, A., Majumdar, R., Murthy, S., & Iyer, S. (2013). Effect of think-pair-share in a large CS1 class: 83% sustained engagement. In: Proceedings of the ninth annual international ACM conference on International computing education research (pp. 137-144). ACM.

Krause, U. M., Stark, R., & Mandl, H. (2009). The effects of cooperative learning and feedback on e-learning in statistics. Learning and Instruction, 19(2), 158-170.

Lim, D. H., & Morris, M. L. (2009). Learner and instructional factors influencing learning outcomes within a blended learning environment. Educational Technology & Society, 12(4), 282-293.

Nelson, C., Hartling, L., Campbell, S., & Oswald, A. E. (2012). The effects of audience response systems on learning outcomes in health professions education. A BEME systematic review: BEME Guide No. 21. Medical Teacher, 34(6), e386-e405.

Storch, N. (2007). Investigating the merits of pair work on a text editing task in ESL classes. Language Teaching Research, 11(2), 143-159.

Szpunar, K. K., Moulton, S. T., & Schacter, D. L. (2013). Mind wandering and education: from the classroom to online learning. Frontiers in Psychology, 4, 495.
Thomas, E. J., & Fink, C. F. (1963). Effects of group size. Psychological Bulletin, 60(4), 371.

Tiesler, G., & Oberdörster, M. (2006). Lärm in Bildungsstätten. Schriftenreihe der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin.



Obacht beim automatischen Markieren

Das Problem: In der letzten Vorlesung haben wir unter anderem die Excel-Funktion HÄUFIGKEIT() kennengelernt. Dabei kam es direkt zu Abweichungen bei den Ergebnissen unserer Studis.

Die Abweichungen waren aber alles andere als zufällig, denn zwei verschiedene Ergebnisse kam besonders prominent vor.

Die einen erhielten für die Häufigkeit der ersten Kategorie den Wert "89", die anderen "117". Wer hat recht? Und warum kommt es zu diesen verschiedenen Ergebnissen?

Die Lösung: Die Ursache liegt in dem Ausreißerwert von "-3", den wir aus der Datenreihe entfernt haben. Dadurch entsteht eine Lücke in der Datenreihe. Diese Lücke hat fatale Auswirkungen, wenn man später versucht, die Daten mit der Tastenkombination STRG+SHIFT+PfeilUnten zu markieren.

Excel markiert dann nämlich nur den Datenbereich bis zur leeren Zelle, nicht bis zum "echten" Ende der Datenreihe.

Unsere Studierenden also, die für die erste Kategorie die Häufigkeit "89" erhalten haben, sind Opfer dieses Verhaltens von Excel geworden. Ihre Funktion HÄUFIGKEIT() bezieht sich im konkreten Fall nicht auf den Datenbereich von C7:C273, sondern nur auf den Bereich von C7:C217, denn C218 ist die leere Zelle.

Zusammenfassung: unbedingt aufpassen, ob der gesamte Datenbereich markiert worden ist, insbesondere Dann, wenn zwischendurch Daten fehlen. Der Fehler wäre übrigens sofort aufgefallen, wenn man das gesamte n aus der Funktion HÄUFIGKEIT() mit dem tatsächlichen n verglichen hätte.
Wait while more posts are being loaded