Box 3: Simulation der Auslosung des repräsentativen Querschnittes auf einem Computer


Die Simulation wird anhand eines Beispiels - der Bundestagswahl 1987 - erläutert.
An der Bundestagswahl nahmen 38.225.294 Wahlberechtigte teil, die 37.867.319 gültige Zweitstimmen abgegeben haben, davon

16.761.572 ( = 44,3 % ) für die CDU/CSU,
14.025.763 ( = 37,0 % ) für die SPD,
03.440.911 ( = 09,1 % ) für die FDP,
03.126.256 ( = 08,3 % ) für die Grünen und
00.512.817 ( = 01,3 % ) für die Splitterparteien.

Zur Vereinfachung der Ausdrucksweise wird im folgenden der Term "Wahlberechtigte, die bei der Wahl eine gültige Zweitstimme abgegeben haben" abgekürzt durch "Wahlteilnehmer".

Der Zweck der Simulation einer Auslosung von 1000 Wahlteilnehmern besteht nicht darin, eine Schätzung für das Resultat der Bundestagswahl zu bekommen - diese wird ja als bekannt vorausgesetzt - , sondern eine Schätzung über die möglichen Abweichungen zu bekommen, die durch die Auslosung des repräsentativen Querschnittes verursacht werden. Im Prinzip könnte die Auslosung durch die Landeslotterie erfolgen, indem jeder Wahlteilnehmer genau ein Los zugeteilt erhält. Von den 37.867.319 Teilnehmern werden dann 1000 "Gewinner" ausgelost und deren Stimmzettel ausgewertet. Praktisch ist dies nicht durchführbar, da alle Wahlteilnehmer erfaßt werden müßten.

Es ist aber erstaunlich einfach, den Auslosungseffekt auf einem Computer zu simulieren und dadurch Aufschluß über die möglichen Abweichungen eines "repräsentativen Querschnittes" zu erhalten. Hierfür denken wir uns die Wahlteilnehmer von 1 bis 37.867.319 numeriert. Zuerst werden alle CDU/CSU-Wähler in irgendeiner Reihenfolge numeriert, anschließend alle SPD-Wähler, dann die FDP-Wähler, dann alle Grün-Wähler und zuletzt alle Wähler von Splitterparteien. Der erste CDU/CSU-Wähler erhält die Nummer 1 und der letzte die Nummer 16.761.572. Somit erhält der erste SPD-Wähler die Nummer 16.761.573 und der letzte die Nummer 30.787.335. Entsprechend wird der erste FDP-Wähler mit der Nummer 30.787.336 versehen und der letzte mit der Nummer 34.228.246. Der erste Grün-Wähler erhält demnach die Nummer 34.228.247 und der letzte die Nummer 37.354.502. Schließlich erhält der erste Splitterparteiwähler die Nummer 37.354.503 und der letzte die Nummer 37.867.319. Dies ist natürlich die Anzahl aller Wahlteilnehmer.

In einem Computer ist ein sogenannter Zufallszahlengenerator eingebaut, der dazu verwendet werden kann, Nummern zwischen 1 und 37.867.319 auszulosen. Dieser Zufallszahlengenerator wird nun tausendmal hintereinander aktiviert und so erhält man die Nummern von 1000 Wahlteilnehmern, die als repräsentativer Querschnitt deklariert werden. Aufgrund der Anordnung der Parteien in der Numerierung - zuerst die Nummern der CDU/CSU-Wähler, dann diejenigen der SPD-Wähler usw. - ist es nun leicht, bereits anhand der ausgelosten Nummer zu bestimmen, für welche Partei der entsprechende Wahlteilnehmer gestimmt hat. Liegt die ausgeloste Nummer zwischen 1 und 16.761.572, dann hat der Wahlteilnehmer für die CDU/CSU gestimmt. Liegt die Nummer zwischen 16.761.573 und 30.787.335, dann hat der ausgeloste Wahlteilnehmer für die SPD gestimmt. Liegt die Nummer zwischen 30.787.336 und 34.228.246, dann hat der ausgeloste Wahlteilnehmer für die FDP gestimmt. Liegt die Nummer zwischen 34.228.247 und 37.354.502, dann hat der Wahlteilnehmer für die Grünen gestimmt. Liegt die Nummer zwischen 37.354.503 und 37.867.319, dann hat der Wahlteilnehmer für eine Splitterpartei gestimmt. Auf diese Art läßt sich leicht das Resultat für den ausgelosten repräsentativen Querschnitt bestimmen, und - was wichtiger ist - die Abweichungen vom amtlichen Resultat. Wie man sieht, ist es für die Ermittlung des Resultats der "Repräsentativumfrage" und der Abweichungen gar nicht notwendig zu wissen, wie die Wahlteilnehmer heißen, die hinter den ausgelosten Nummern stehen.

Auf einem Homecomputer - z.B. einem SCHNEIDER CPC 464, der heute für weniger als 400 DM zu haben ist - dauert die Auslosung eines repräsentativen Querschnittes vom Umfang 1000 bei vier Parteien plus Splitterparteien inklusive der Auswertung der ausgelosten Stimmzettel weniger als 10 Sekunden, auf einem Großcomputer etwa 10 Millisekunden. Man kann daher leicht hunderttausend oder gar eine Million repräsentativer Querschnitte auslosen und die Abweichungen der Resultate vom tatsächlichen Wahlergebnis untersuchen.

Die im Vorwort I/Seite 9 angegebenen 10 Auslosungen des repräsentativen Querschnitts (und ebenso die 100 in Abschnitt VII/Seite 2) kann jeder Leser mit einem Homecomputer leicht selbst durchführen. Hierzu ist weiter unten ein Programm in BASIC angegeben. Je nach Zufallszahlengenerator bzw. Startwert desselben werden etwas andere Resultate herauskommen. Bei 100 Auslosungen (Dauer ca. 14 Minuten) werden die Angaben über auslosungsbedingte Spielräume der Tabelle in Abschnitt VII/Seite 9 größenordnungsmäßig erkennbar, bei 1000 Auslosungen (Dauer ca. 140 Minuten) schon relativ genau. Insbesondere wird klar, daß in über fünfzig Prozent der Auslosungen die Resultate nicht innerhalb folgender Spielräume liegen:

CDU/CSU SPD FDP Grüne
42,3% - 46,3% 35,0% - 39,0% 8,1% - 10,1% 7,3% - 9,3%

Die Aussagen über auslosungsbedingte Abweichungen scheinen zunächst auf die Bundestagswahl 1987 beschränkt zu sein. Dies ist jedoch nicht der Fall, weil

  1. die Anzahl der Wahlteilnehmer so gut wie keine Rolle spielt, es können hunderttausend oder hundert Millionen sein.
  2. eine genaue Kenntnis der Parteistärken nicht erforderlich ist, da die Abweichungen nicht von den Parteistärken selbst, sondern nur von deren Standardabweichungen abhängen. Es reicht deshalb aus, die Größenordnungen der Parteistärken zu kennen. Die CDU/CSU oder die SPD können zwischen 30% und 60% variieren und die FDP oder die Grünen zwischen 7% und 12%, ohne daß die simulierten Abweichungen wesentlich beeinflußt werden. Durch Standardisierung kann das Problem auf gleichstarke Parteien zurückgeführt werden.

Die Aussagen über die auslosungsbedingten (standardisierten) Abweichungen hängen jedoch wesentlich vom Umfang des repräsentativen Querschnitts sowie der Anzahl der Parteien ab. Je mehr Parteien, desto größer die Abweichungen. Je größer der Umfang des repräsentativen Querschnitts, desto kleiner die Abweichungen.

Für die effektive Durchführung der Simulation auf einem Computer wird nur die Anzahl der Parteien, ihre prozentualen Stärken und der Umfang des repräsentativen Querschnitts eingegeben, nicht aber die Anzahl der Wahlteilnehmer. Die Nummer eines Wahlteilnehmers wird durch ein kleines Intervall der Länge L=1/37.867.319 ersetzt, und diese werden der Reihe nach auf einer Zahlenachse mit Anfangspunkt 0 und Endpunkt 1 aufgetragen, wie dieses in folgendem Bild illustriert wird

Der im Computer eingebaute Zufallsgenerator ist ein Auswahlverfahren, welches Zahlen zwischen 0 und 1 auslost und welches die in Abschnitt III/Seite 12-13 erwähnten Kriterien der Chancengleichheit und der Regellosigkeit approximativ erfüllt. Bei jeder Aktivierung des Zufallszahlengenerators wird eine Zahl zwischen 0 und 1 ausgewählt, welche in genau eines der obigen Intervalle fällt. Dadurch wird die Nummer eines Wahlteilnehmers festgelegt, mit anderen Worten, dadurch ist ein Wahlteilnehmer ausgelost worden. Die Zuordnung Zufallszahl --> Nummer des Wahlteilnehmers wird durch folgendes Bild verdeutlicht:

Wie man sieht, entsprechen

Im unten abgedruckten BASIC-Programm wird die Auslosung von 1000 Wahlteilnehmern und die Auswertung ihrer Stimmzettel durchgeführt. Die Variablen CDU, SPD, FDP, Gruen und Splitter dienen als Zähler für die Stimmzettel der ausgelosten Wahlteilnehmer. Der Inhalt dieser Zählervariablen sowie ihre Abweichung vom Sollwert ( = tatsächliches Resultat der Bundestagswahl 1987) wird nach 1000 Auslosungen auf den Bildschirm geschrieben. Dann beginnt eine neue Auslosung von 1000 Wahlteilnehmern und die Auswertung ihrer Stimmzettel. Wenn der Leser die Resultate und Abweichungen gesehen hat, kann er das Programm abbrechen.

Der Leser kann das Programm auch verändern. Er kann andere Parteistärken eingeben und die Anzahl n der Interviews erhöhen oder erniedrigen. Die Modifikationen hierfür sind einfach. Man kann auch die Anzahl der Parteien ändern, indem zusätzliche Zählervariablen in das Programm eingebaut werden. Ferner können Wiederholungsbefragungen wie in Abschnitt VIII simuliert werden, um damit Pseudo-Trends sichtbar zu machen.

Anmerkungen zum Programm:

Einige der verwendeten Befehle sind spezifisch für den BASIC-Dialekt auf dem SCHNEIDER CPC 464, zum Beispiel TIME, RANDOMIZE, RND, der Aufbau der IF-THEN-Befehle und die Form der PRINT-Befehle.

Auf einem anderen Computer, etwa einem Commodore C64 sind diese Befehle entsprechend dem dort verwendeten BASIC-Dialekt zu verändern.

1 ´ Ausdruck der Überschrift
2 ´
3 CLS : PRINT
4 PRINT " CDU/CSU SPD FDP Grüne Splitter"
5 ´
10 RANDOMIZE(TIME) ´Setzen des Zufallszahlengenerators mit Hilfe
11 ´einer im Computer eingebauten Uhr ( TIME )
12 n=1000 ´Festlegen des Querschnittumfangs
13 CDU=0 ´Zähler der CDU/CSU - Stimmen wird 0 gesetzt
14 SPD=0 ´Zähler der SPD - Stimmen wird 0 gesetzt
15 FDP=0 ´Zähler der FDP - Stimmen wird 0 gesetzt
16 Gruen=0 ´Zähler der Grünen - Stimmen wird 0 gesetzt
17 Splitter=0 ´Zähler der Splitter - Stimmen wird 0 gesetzt
18 ´
20 FOR wtn=1 to n ´Schleife für die Auslosung des Querschnitts
21 z=RND ´Erzeugen einer Zufallszahl
22 ´
23 IF z<0,443 THEN CDU=CDU+1 : GOTO 37 ´Abfrage nach CDU/CSU - Stimme und
24 ´Erhoehen des CDU/CSU - Zählers, wenn
25 ´z < 0,44
26 IF z<0,813 THEN SPD=SPD+1 : GOTO 37 ´Abfrage nach SPD - Stimme und
27 ´Erhoehen des SPD - Zählers, wenn
28 ´z < 0,813
29 IF z<0,904 THEN FDP=FDP+1 : GOTO 37 ´Abfrage nach FDP - Stimme und
30 ´Erhoehen des FDP - Zählers, wenn
31 ´z < 0,904
32 IF z<0,987 THEN Gruen=Gruen+1 : GOTO 37 ´Abfrage nach Grünen - Stimme und
33 ´Erhoehen des Grünen - Zählers, wenn
34 ´z < 0,987
35 Splitter=Splitter+1 ´Erhoehen des Splitter- Zählers, wenn
36 ´z > 0,987
37 NEXT wnt
38 ´
40 ´ Ausgabe der Ergebnisse der Auslosung des repräsentativen Querschnitts
41 ´
42 PRINT : PRINT" "; : PRINT USING"##.#";CDU/n*100; : PRINT" % ";
43 PRINT USING"##.#";SPD/n*100; : PRINT" % ";
44 PRINT USING"##.#";FDP/n*100; : PRINT" % ";
45 PRINT USING"##.#";Gruen/n*100; : PRINT" % ";
46 PRINT USING"##.#";Splitter/n*100; : PRINT" % ";
47 ´
50 ´ Ausgabe der Abweichungen von den tatsächlichen Werten der Bundestagswahl
51 ´
52 PRINT : PRINT" "; : PRINT USING"##.#";CDU/n*100-44.3; : PRINT" % ";
53 PRINT USING"##.#";SPD/n*100-37; : PRINT" % ";
54 PRINT USING"##.#";FDP/n*100-9.1; : PRINT" % ";
55 PRINT USING"##.#";Gruen/n*100-8.3; : PRINT" % ";
56 PRINT USING"##.#";Splitter/n*100-1.3; : PRINT" % ";
57 ´
58 GOTO 13



zurück zu "III. Der repräsentative Querschnitt"

zurück zur Box 2: "Was ist ein Miniaturbild?"

weiter zur Box 4: "Kommerzielle Grundlagen vom Meinungsumfragen"

weiter zu "IV. Die 5%-Hürde"

zurück zum Inhaltsverzeichnis

zurück zum Archiv