Variance - Statistics and Methodology

# *English version* **Variance** is a [[Measures of central tendency and dispersion|measure of dispersion]], and a very central concept in methodology and statistics. It is calculated as follows: $ σ^2 = \frac{\sum_{i=1}^{N}(x_{i} - {μ})^2}{N} $ This is the population variance, in which N is the population size, xi the value of element i, and μ the mean of the population. The sample variance is calcualted as follows: $ s^2 = \frac{\sum_{i=1}^{n}(x_{i} - {\bar{x}})^2}{n-1} $ In this case, n is the sample size, xi the value of element i, and x̄ the sample mean. It reflects the average squared distance from the mean. ## Components of variance The total variance observed in the [[Dependent variable|dependent variable]] is the sum of primary, secondary and error variance. **Primary variance** is the variance in the dependent variable that can be explained by the variance in the [[Independent variable|independent variable]]. **Secondary variance** is the variance in the dependent variable that can be explained by [[Variable#Confouding and control variables|confounding variables]]. **Error variance** is the vriance in the dependent variable that is from an unknown source. ## Standard deviation and coefficient of variation As a measure of dispersion, variance is hard to interprete. The unit of variance is the squared version of the respective parameter. For example when calculating the variance in running performance (min) the unit of the variance will be min2. Therefore, the [[Measures of central tendency and dispersion#Variance and standard deviation|standard deviation(s)]] is often used, which is the squared root of the variance. $ s = \sqrt{s^2} $ Moreover, variance cannot be compared between parameters with different units. To enable this the coefficient of variation can be calculated. $ V = \frac{s}{\bar x} $ The coefficient of variance is an index, and does not have an unit. ___ ___ --- # *German version* # Varianz Im Rahmen der deskriptiven Statistik wird zwischen **Lage- und Streuungsparametern** unterschieden (siehe [[Measures of central tendency and dispersion|Maße der zentralen Tendenz und Streuungsmaße]]). Für die statistische Auswertung von Daten stellt die **Varianz** eines der wichtigsten Streuungsmaße dar. > Die Varianz ist die mittlere quadratische Abweichung vom Mittelwert. > Die Formel ihrer Berechnung lautet: > $ s^2 = \frac{\sum_{i=1}^{n}(x_{i} - {\bar{x}})^2}{n-1} $ > Aus der Varianz können die **Standardabweichung** und der **Variationskoeefizient** berechnet werden. > > **Standardabweichung:** $ s = \sqrt{s^2} $ > **Variationskoeffizient:**$ V = \frac{s}{\bar x} $ Es handelt sich bei der Varianz um eine Maßzahl dafür, wie stark die Einzelwerte einer Gruppe von Werten, um den Mittelwert der Gruppe streuen. Statistische Tests wie z. B. die [[One-way ANOVA| ANOVA]] oder [[One-way MANOVA| MANOVA]] beruhen auf dem Varianzvergleich zwischen Untersuchungsgruppen. Weiterhin stellt die gleichmäßige Verteilung der Varianz zwischen den Untersuchungsgruppen (=[[Assumptions#Homogeneity of variance|Homoskedastizität]]) neben der Normalverteilung eine Voraussetzung parametrischer [[Hypothesis testing|Hypothesentests]] dar. ## Komponenten der Varianz (siehe auch: [[MaxConMin]]) * **Primärvarianz** Jede systematische Veränderung der [[Dependent variable|abhängigen Variable]], die allein auf die Wirkung der [[Independent variable|unabhängige Variable]]zurückzuführen ist. * **Sekundärvarianz** Jede *systematische Veränderung* der Werte der AV, die nicht auf die Wirkung der UV zurückzuführen ist, sondern auf die Wirkung von Störvarianblen. * **Fehlervarianz** Jede *unsystematische Veränderung* der Werte der AV ## Standardabweichung und Variationskoeffizient Bei der Berechnung der Varianz werden auch die Einheiten quadriert (z. B.: cm2, kg2). Daraus ergibt sich, dass die Varianz als deskriptiver Parameter umständlich zu interpretieren ist. Daher wird anstelle der Varianz meist die **Standardabweichung** (Wurzel der Varianz) angegeben. Wenn die Verteilung der Daten bekannt ist, lassen sich mithilfe der Standardabweichung auch direkt Häufigkeiten berechnen. So befinden sich z. B. bei normalverteilten Daten 68% der Werte in dem Intervall von der Breite von zwei Standardabweichungen um den Erwartungswert. Der **Variationskoeffizient** ermöglicht einen Vergleich von Gruppen oder Variablen mit verschiedenen Einheiten. So lässt sich anhand des Variationskoeffizienten z. B. die Streuung der Zielzeiten vom 100-Meter-Lauf mit der Streuung der erzielten Weiten beim Sperrwurf vergleichen.