Online-Stichproben – die richtige Stichprobengröße bestimmen


Im Rahmen fundierter Umfragen, Marktforschungen oder Statistiken ist die Auswahl des Stichprobenumfangs elementar für den Erfolg. Dies birgt gewisse Herausforderungen, da zum einen unterschiedliche Schlüsselwerte, zum anderen eine repräsentative Stichprobengrößen erforderlich sind. Im Folgenden erfahren Sie alle relevanten Informationen zur Bestimmung und Berechnung Ihrer Stichprobengrößen.

Was ist eine Stichprobe?

Stichproben werden zur Repräsentation der Gesamtpopulation oder der Grundgesamtheit genutzt. Sie sind eine ausgewählte Teilmenge, die hochgerechnet und verallgemeinert werden kann, um allgemeingültige Aussagen über größere oder schwer fassbare Gruppen treffen zu können, wie beispielsweise ein Wahlvolk.

Sowohl ihre Reliabilität und ihr Umfang als auch ihre Repräsentativität spielen eine bedeutende Rolle für gute und aussagekräftige Ergebnisse.

Ein Beispiel für Stichproben wäre wie folgt:
  • Grundgesamtheit → Erstsemesterstudenten in Berlin

  • Stichprobe → Erstsemesterstudenten drei zufällig gewählter Studiengänge

  • Statistische Einheit → ein befragter Student

  • Merkmal → Englischkenntnisse

  • Merkmalsausprägung → Englischkenntnisse: 78 %

Schlüsselwerte einer Stichprobe bestimmen

Eine große Schwierigkeit für Forscher ist die Anzahl der Antworten für statistisch einwandfreie Ergebnisse: Wie groß muss eine repräsentative Stichprobe sein?

Während ein größerer Stichprobenumfang genauere Studienresultate liefern kann, geht dieser auch häufig mit einem höheren Preis und Aufwand einher. Es gilt herauszufinden, wann Kosten und Ergebnisse ausgewogen sind und eine Studie als sinnvoll und repräsentativ erachtet werden kann.

Bevor die optimale Stichprobengröße berechnet werden kann, müssen einige Aspekte und Variablen (sogenannte Schlüsselwerte) über die Gesamtpopulation und die benötigte Stichprobe festgelegt werden. Welche das sind, erfahren Sie im Folgenden.

Populationsgröße

Mit der Populationsgröße sind alle Menschen einer demografischen Gruppe gemeint. Während bei kleinen Studien mit einer möglichst präzisen Zahl gearbeitet wird, kann für größere Studien auch ein Schätzwert verwendet werden.

Denn je kleiner die Gruppe, desto wichtiger ist Präzision, um eine repräsentative statistische Auswertung zu erhalten.

  • Wird eine lokale Organisation mit 15 Mitarbeitern untersucht, sollte die Populationsgröße akkurat angegeben werden.

  • Bei größeren Studien haben Abweichungen eine geringere statistische Auswirkung. Zudem ist es in vielen Fällen nicht möglich, eine präzise Zahl für die Populationsgröße herauszufinden.

  • Handelt es sich beispielsweise um die Bevölkerung Deutschlands, würde es reichen von 80 Millionen Menschen auszugehen, wobei der tatsächlich Wert um einige Hunderttausende abweicht.

Fehlermarge (Konfidenzintervall)

Die Fehlermarge oder das Konfidenzintervall wird als Prozentsatz angegeben und zeigt, wie nah die Antworten aus der gewählten Stichprobe an den echten Wert der Gesamtpopulation heranreichen werden. Die Marge bezieht sich somit auf die Anzahl der zugelassenen Fehler in den Ergebnissen, da keine Stichprobe perfekt ist.

Generell lassen kleinere Fehlermargen präzisere Antworten zu, benötigen dafür allerdings einen größeren Stichprobenumfang.

  • Die Fehlermarge wird als positive oder negative Prozentangabe angezeigt.

  • Wenn 70 % für Möglichkeit 2 sind und die Fehlermarge +/- 10 % beträgt, bedeutet dies, dass die Studienleiter sicher sind, dass zwischen 60 % und 80 % der Gesamtpopulation Möglichkeit 2 wählen würden.

Konfidenzniveau

Das Konfidenzniveau steht in Bezug zur Fehlermarge. Es zeigt an, wie hoch die Sicherheit ist, dass die Gesamtpopulation gut von der Stichprobe repräsentiert wird. Demnach gibt es an, wie sicher es ist, dass die Resultate innerhalb der bestimmten Fehlermarge bleiben.

  • Das Konfidenzniveau wird ebenfalls in Prozent angegeben.

  • Je höher das Konfidenzniveau, desto präziser die Genauigkeit.

  • Ein höheres Konfidenzniveau erfordert eine umfassendere Stichprobengröße

  • Wenn unter Einberechnung der Fehlermarge zwischen 60 % und 80 % der Gesamtpopulation Möglichkeit 2 wählen würden und das Konfidenzniveau mit 90 % angegeben wird, bedeutet dies, dass zu 90 % Sicherheit herrscht, dass zwischen 60 % und 80 % tatsächlich diese Wahl treffen würden.

  • Am häufigsten werden Konfidenzniveaus von 90 %, 95 % oder 99 % gewählt.

Standardabweichung

Die Standardabweichung gibt an, wie viel Varianz bei den Antworten erwartet wird. Je höher die Varianz ist, desto größer ist auch die Standardabweichung. Sie zeigt an, wie dicht die Daten sich um den Mittelwert häufen und wie weit sie sich zwischen Maximum und Minimum verteilen. Da dies vor der Durchführung der Studie nicht wirklich feststellbar ist, wird dieser Wert meist auf 0,5 (50 %) gesetzt.

  • Mit einem Wert von 50 % (der den Schlimmstfall darstellt) wird sicher gegangen, dass der ermittelte Stichprobenumfang groß genug ist, um für die Gesamtpopulation repräsentativ zu sein.

  • Zudem bilden extreme Antworten wahrscheinlicher ein akkurates Bild ab als moderate Resultate.

Der Z-Wert

Der auf dem Konfidenzniveau basierende Z-Wert ist konstant und stellt den üblichen Mittelwert dar oder bezeichnet die Nummer an Standardabweichungen, die zwischen dem gewählten Wert und dem Populationsdurchschnitt liegen.

Da es relativ komplex ist, den Z-Wert manuell auszurechnen oder ihn anhand einer Z-Wert-Tabelle herauszufinden, stellen wir Ihnen hier Z-Werte für häufig festgelegte Konfidenzniveaus zur Verfügung:

  • 80 % Konfidenzniveau → 1,28 Z-Wert

  • 85 % Konfidenzniveau → 1,44 Z-Wert

  • 90 % Konfidenzniveau → 1,65 Z-Wert

  • 95 % Konfidenzniveau → 1,96 Z-Wert

  • 99 % Konfidenzniveau → 2,58 Z-Wert

Benötigen Sie andere Z-Werte, finden Sie eine Übersicht in dieser Tabelle.

Berechnung der Mindestgröße einer Stichprobe

Nachdem die Schlüsselwerte festgelegt worden sind, geht es an die Berechnung der Stichprobengröße. Es gilt eine repräsentative Stichprobe zu wählen, die dennoch realistisch durchführbar ist. Verschiedene Formeln helfen unter Berücksichtigung der Schlüsselwerte, einen sinnvollen Stichprobenumfang zu finden.

Standardformel

Die Standardformel gilt vor allem für kleinere oder mittlere Gesamtpopulationen. Anhand dieser lässt sich die Stichprobe unkompliziert berechnen:

Mit folgendem Beispiel wird die Standardformel verdeutlicht:

Gesamtpopulation / Populationsgröße (N) = 500
Z-Wert (z) = 1,96
Fehlermarge (e) = 0,1
Standardabweichung (p) = 0,5

Daraus folgt dieses Rechenbeispiel:

Formel für sehr große oder unbekannte Populationen

Handelt es sich um eine Gesamtpopulation, deren Größe sich nicht genau festlegen lässt oder die sehr umfangreich ist, reicht es den oberen Teil der Standardformel zu verwenden.

Diese sieht dann wie folgt aus:

Sind die Schlüsselwerte mit Ausnahme der Populationsgröße wie oben angegeben, ergibt sich dieses Resultat:

Erscheint die Stichprobengröße Ihnen zu umfangreich, können Sie das Konfidenzniveau reduzieren oder Ihre Fehlermarge erhöhen. Dadurch steigt zwar die Anzahl der möglichen Fehler in Ihrer Stichprobe, doch die Summe der benötigten Antworten sinkt und dadurch auch die Kosten und der Aufwand Ihrer Studie.

Ein repräsentativer Stichprobenumfang lässt sich zudem mit unserem Stichprobenrechner ausrechnen.