Statistische Begriffe
Konfidenzintervall
Die Unsicherheiten der Auswertungen werden mit Konfidenzintervallen abgeschätzt. Das 95 % Konfidenzintervall bezeichnet den Bereich, der bei unendlicher Wiederholung eines Zufallsexperiments mit einer Wahrscheinlichkeit von 95 Prozent den wahren Wert der Grundgesamtheit einschliesst. Das Konfidenzintervall wird auch als Vertrauensintervall oder Erwartungsbereich bezeichnet.
Lagemass
Ein Lagemass ist eine mathematisch definierte statistische Kenngrösse, welche die Lage (Lokation) einer Reihe von Beobachtungswerten beschreibt. Die gebräuchlichsten Lagemasse sind das arithmetische Mittel und der Median. Arithmetisches Mittel und Median gibt es auch in einer gewichteten Form, d.h. bei Beobachtungswerten, die nicht alle dasselbe Gewicht haben.
Median
Der Median oder Zentralwert teilt die nach Grösse geordneten Beobachtungswerte in zwei gleich grosse Hälften. Die eine Hälfte der Werte liegt über, die andere unter dem Median. Bei einer streng symmetrischen Häufigkeitsverteilung fällt der Median mit dem arithmetischen Mittel zusammen. Im Falle einer asymmetrischen Verteilung, z.B. des Einkommens, mit hohen Extremwerten liegt er unter dem arithmetischen Mittel und bei tiefen Extremwerten darüber. Je deutlicher die Asymmetrie ist, desto grösser ist der Unterschied zwischen arithmetischem Mittel und Median.
Perzentil und Quantil
Für den gesamten Wertebereich einer Variablen lässt sich mit Hilfe der Summenhäufigkeitsverteilung abschätzen, welcher Anteil aller Untersuchungseinheiten maximal einen bestimmten Wert aufweist. Diesen Wert bezeichnet man als Quantil bzw. bei Verwendung von prozentualen Anteilen als Perzentil. Das bekannteste Perzentil, das die untere Hälfte aller Werte von der oberen trennt, ist das 50 Prozent Perzentil, der sogenannte «Median». Weitere häufig verwendete Werte sind die 25 und 75 Prozent Perzentile, die das untere und das obere Viertel der Verteilung abschneiden. Man bezeichnet sie daher auch als untere und obere Quartile bzw. als erstes und drittes Quartil (der Median ist das zweite Quartil).
Pooling
Stichprobendaten einzelner Jahre werden zu einem Datensatz vereinigt (englisch: pooled). Dadurch erhöht sich die Stichprobengrösse; als Bezugsperiode gilt jedoch nicht mehr das einzelne Jahr, sondern der gesamte Zeitraum der zusammengefassten Daten.
Populationsgewicht
Eine Stichprobe ist dadurch charakterisiert, dass jede Einheit der Grundgesamtheit eine berechenbare Wahrscheinlichkeit hat, in die Stichprobe zu gelangen. Diese Wahrscheinlichkeit ist aber bei einer geschichteten Zufallsstichprobe nicht für alle Einheiten die gleiche. Jeder gewählten Einheit wird daher entsprechend ihrer Auswahlwahrscheinlichkeit ein Gewicht zugeordnet, das angibt, wie viele Einheiten der Grundgesamtheit durch die betreffende Einheit aus der Stichprobe repräsentiert sind.
Saldo
Der Saldo bezeichnet die Differenz zwischen zwei oder mehr Kennzahlen. Der Wanderungssaldo bezeichnet zum Beispiel die Differenz zwischen Zu- und Wegzügen.
Schichtung
Bei einer geschichteten Zufallsstichprobe (z.B. Bevölkerungsbefragung der Stadt Zürich) wird die entsprechende Grundgesamtheit in mehrere kleinere Gruppierungen, welche als Schichten bezeichnet werden, unterteilt.
Stichprobenrahmen
Der Zugang zur Grundgesamtheit erfolgt oft über eine Liste, in der die Objekte aufgeführt sind. Diese Liste wird Stichprobenrahmen genannt. Bei Bevölkerungsbefragungen wird oft das Bevölkerungsregister als Stichprobenrahmen benutzt.
Variationskoeffizient
Der Variationskoeffizient das Verhältnis der Standardabweichung zum Mittelwert. Der Variationskoeffizient ist nützlich, wenn Standardabweichungen von Stichproben mit stark unterschiedlichen Mittelwerten