Hier können diverse statistische Kennzahlen eines Datensatzes ermittelt werden. Die Daten werden dabei durch ein frei wählbares Zeichen getrennt (Standard ist der Beistrich) eingegeben. Standardmäßig wird der Punkt als Dezimalzeichen verwendet, jedoch kann auch dieses frei gewählt werden.
Die Anzahl gibt an, aus wie vielen Elementen der Datensatz besteht.
Die Summe entspricht der Summe aller Elemente xi des Datensatzes, also x1+x2+...+xn=n∑i=1xi
Bei dieser Kennzahl werden alle Elemente xi des Datensatzes multipliziert, also x1⋅x2⋯xn=n∏i=1xi
Hier werden die Beträge der Elemente des Datensatzes addiert: |x1|+|x2|+...+|xn|=n∑i=1|xi|
Der Modus (Modalwert) ist jener Wert der in der Stichprobe am häufigsten vorkommt. Er ist nicht eindeutig, da es mehrere Werte geben kann, die am häufigsten vorkommen.
Das arithmetische Mittel ˉx von n Werten kann durch folgende Formel ermittelt werden: ˉx=1nn∑k=1xk=x1+x2+...+xnn
Das Minimum xmin ist der kleinste Wert des Datensatzes.
Das Maximum xmax ist der größte Wert des Datensatzes.
Die Spannweite entspricht dem Abstand zwischen Maximum und Minimum, also xmax−xmin.
Der Median (auch Zentralwert) wird ermittelt, indem man zunächst die Stichprobe der Größe nach ordnet. Ist die Anzahl der Stichprobenelemente ungerade, so entspricht der Median dem mittleren Wert. Bei einer ungeraden Anzahl entspricht der Median dem arithmetischen Mittel der beiden mittleren Werte.
Das geometrische Mittel von n Werten, die allesamt größer als 0 sind, entspricht der n-ten Wurzel des Produktes dieser Werte. Die Formel dazu lautet: xgeo=n√x1⋅x2⋯xn=n√n∏k=1xk
Das harmonische Mittel der Zahlen x1,...,xn entspricht dem Kehrwert des arithmetischen Mittels der Kehrwerte dieser Zahlen. Die Formel lautet: xharm=n1x1+...1xn
Gegeben sind die Werte x1,x2,...,xn mit dem arithmetischen Mittel ˉx. Dann wird die Varianz der Grundgesamtheit hier durch die folgende Formel berechnet: 1nn∑k=1(xk−ˉx)2 Es gibt jedoch verschiedene Definitionen der Varianz. Jene mit Nenner n−1 wird hier als Varianz der Stichprobe bezeichnet.
Gegeben sind die Werte x1,x2,...,xn (wobei es mindestens 2 Werte geben muss) mit dem arithmetischen Mittel ˉx. Dann wird die Varianz der Stichprobe hier durch die folgende Formel berechnet: 1n−1n∑k=1(xk−ˉx)2 Es gibt jedoch verschiedene Definitionen der Varianz. Jene mit Nenner n wird hier als Varianz der Grundgesamtheit bezeichnet.
Gegeben sind die Werte x1,x2,...,xn mit dem arithmetischen Mittel ˉx. Die Standardabweichung der Grundgesamtheit entspricht der Wurzel der Varianz der Grundgesamtheit, also √1nn∑k=1(xk−ˉx)2 Es gibt jedoch verschiedene Definitionen der Standardabweichung. Jene mit Nenner n−1 wird hier als Standardabweichung der Stichprobe bezeichnet.
Gegeben sind die Werte x1,x2,...,xn (mindestens zwei Werte) mit dem arithmetischen Mittel ˉx. Die Standardabweichung der Stichprobe entspricht der Wurzel der Varianz der Stichprobe, also √1n−1n∑k=1(xk−ˉx)2 Es gibt jedoch verschiedene Definitionen der Standardabweichung. Jene mit Nenner n wird hier als Standardabweichung der Grundgesamtheit bezeichnet.
Gegeben sind die Werte x1,x2,...,xn mit dem arithmetischen Mittel ˉx und der empirischen Standardabweichung s. Die empirische Schiefe wird folgendermaßen berechnet: 1nn∑k=1(xk−ˉxs)3 Die Schiefe gibt Auskunft über die Assymetrie des Datensatzes. Ist sie kleiner als 0, so ist der Datensatz rechtssteil bzw. linksschief (er fällt auf der linken Seite flacher ab als auf der rechten). Ist sie größer als 0, dann ist er linkssteil bzw. rechtsschief.
Gegeben sind die Werte x1,x2,...,xn mit dem arithmetischen Mittel ˉx und der empirischen Standardabweichung s. Die empirische Wölbung (auch Kurtosis oder zentrales Moment 4. Ordnung genannt) wird folgendermaßen berechnet: 1nn∑k=1(xk−ˉxs)4 Sie gibt Auskunft über die Steilheit des Datensatzes. Je größer der Wert ist, umso steiler (spitzer) ist der Datensatz verteilt.
Die Normalverteilung hat Wölbung 3. Der Exzess gibt an, wie ähnlich die Wölbung eines beliebigen Datensatzes mit jener der Normalverteilung ist. Man berechnet den Exzess, indem man von der Wölbung 3 abzieht. Es gibt nun drei Fälle:
(1) Der Exzess ist 0: Der Datensatz ist normalgipflig. Er hat dieselbe Wölbung wie die Normalverteilung.
(2) Der Exzess ist größer als 0: Der Datensatz ist steilgipflig. Er hat eine größere Wölbung als die Normalverteilung und ist daher spitzer.
(3) Der Exzess ist kleiner als 0: Der Datensatz ist flachgipflig. Er hat eine kleinere Wölbung als die Normalverteilung und ist daher flacher.
Das 1. Quartil (auch unteres Quartil) q1 gibt an, wo das kleinste Viertel eines geordneten Datensatzes endet. Höchstens ein Viertel aller Werte ist kleiner als q1 und höchstens drei Viertel aller Werte sind größer als q1.
Es gibt verschiedene Definitionen, anhand welcher das 1. Quartil berechnet werden kann. Diese führen teilweise zu unterschiedlichen Ergebnissen. Das vom Online-Tool berechnete Ergebnis ist jenes, das auch GeoGebra ausgeben würde. Das in Klammern angegebene Ergebnis entspricht der Definition auf Wikipedia.
Das 3. Quartil (auch oberes Quartil) q3 gibt an, wo das größte Viertel eines geordneten Datensatzes beginnt. Höchstens drei Viertel aller Werte sind kleiner als q3 und höchstens ein Viertel aller Werte ist größer als q3.
Es gibt verschiedene Definitionen, anhand welcher das 3. Quartil berechnet werden kann. Diese führen teilweise zu unterschiedlichen Ergebnissen. Das vom Online-Tool berechnete Ergebnis ist jenes, das auch GeoGebra ausgeben würde. Das in Klammern angegebene Ergebnis entspricht der Definition auf Wikipedia.
Der Interquartilsabstand (engl. interquartile range) entspricht der Differenz zwischen 1. Quartil und 3. Quartil. Er wird mittels IQR=q3−q1 berechnet.