# *English version* ## Assumptions The chi-square test is a non-prameteric test, therefore the assumptions that apply to parametric tests do not apply here. The following assumptions apply to the chi-square test: - The dependent variable is expressed in frequency/count, so at the [[Levels of measurement#Categorical variables| categorical level]] - The levels of the independent variable are mutual exclusive. - Each participant can only be represented in one cell of the contigency table. Meaning that a chi-square test cannot applied in a repeated measures design. - [[Assumptions#Independence | Independence]] of the levels of the independent variable. - The [[Chi-square test#^5d5d6d|expected count (E)]] should be 5 or higher in each cell. ## Test statistic ### Chi-square statistic (*x<sup>2</sup>* statistic) The *x<sup>2</sup>* statistic assesses whether there is a relationship between two categorical variables. This is done by determining the difference between the expected (E) count in case there is no relation between the two variables (the null hypothesis), and the observed count (O). The formula is as follows: $ x^2 = \sum{\frac{(O_{ij} - E_{ij})^2}{E_{ij}}} $ $ E_{ij} = \frac{{row_{i}}\times{column_{j}}}{n} $ Row<sub>i</sub> represents the total count of the specic row, and column<sub>j</sub> represents the total count of the specific column. The sample size is represented by n. The chi-square value is a standardized measure of dispersion of the expected outcome in case the null-hypothesis is true. ^5d5d6d ## Interpreting the output ***Pearson chi-square - value***; shows the outcome of the chi-square statistic. ***df***; shows the degrees of freedom of the respective test, which is calculated as follows: $ df = {(rows - 1)}\times{(columns -1)}$ ***Assymptotic significance (2-sided)***; shows the respective p-value of the chi-square test. ### Example Depicted below is an example of the output of a chi-square test in SPSS. > Is there a relation between gender and the amount of people who have seen the champions league match of last night. The significance level is set at 0.05. > **SPSS output** > ![[Pasted image 20210224095043.png]] > - The chi-square value is 2.506, the associated p-value is above 0.05, meaning that there is no [[Significance|significant]] relation between gender and the amount of people watching champions league last night. ___ __________________________ ____________________________ # *German version* Der zweidimensionale χ2 -Test (gesprochen: "Chi-Quadrat") wird zur Untersuchung der zentralen Tendenz zwischen zwei Gruppierungen beziehungsweise zur Analyse der Häufigkeitsverteilung zweier Gruppierungen nach Einteilung in verschiedene Kategorien benutzt. Dabei stellt der zweidimensionale Test eine Erweiterunf des eindimensionalen Tests um eine weitere Variable mit mindestens zwei Stufen dar. Dabei wird getestet, ob sich eine beobachtete von einer theoretisch erwarteten Häufigkeitsverteilung (signifikant) unterscheidet. ## Annahmen & Voraussetzungen - Die Daten sind nominalskaliert - Die unabhängige Variable ist einfaktoriell - univariate Operationalisierung der abhängigen Variable ## Teststatistik Für die Berechnung des χ2 -Werts sind folgende Begriffe und Formeln wichtig: ***beobachtete Häufigkeiten***; Aufgenommene Datenverteilung ***erwartete Häufigkeiten***; Berechnung: ![[Pasted image 20210102190502.png]] ***Formel***; ![[Pasted image 20210102190745.png]] ***Freiheitsgrade***; df = (k - 1) * (l - 1) ## Interpretation und Berechnung der Ergebnisse ### Signifikanzprüfung - Vergleich des errechneten χ2 –Werts (emp) mit dem kritischen (krit) - der kritische Prüfwert wird anhand der χ2 –Verteilung für die entsprechenden Freiheitsgrade bestimmt und schneidet einen Anteil der Fläche unter der χ2 –Verteilungsfunktion ab - Entscheidung: ![[Pasted image 20210102180510.png]] > **Beispiel** >*Empirische Hypothese:* > Die Höhe der Ausbildung soll einen positiven Einfluss auf die Länge der Arbeitslosigkeit haben. > --> H1: Mit der Höhe der Ausbildung sinkt die Dauer der Arbeitslosigkeit. > --> H0: Mit der Höhe der Ausbildung steigt die Dauer der Arbeitslosigkeit oder es besteht kein Unterschied. > _ > *Darstellung in Tabellenform:* ![[Pasted image 20210102193616.png]] > _ > *Berechnung χ2 –Wert:* ![[Pasted image 20210102194421.png]] > > *Interpretation des gefundenen t-Werts* > - Berechnung Freiheitsgrade und Bestimmung des "kritischen Prüfwerts" ![[Pasted image 20210102194545.png]] > - Vergleich des empirisch ermittelten t-Werts mit dem "kritischen Prüfwert" ![[Pasted image 20210102194559.png]] > --> da der empirisch ermittelte Wert höher als der kritische Prüfwert ist, wird die Nullhypothese zurückgewiesen > --> es besteht ein signifikanter Unterschied zur erwarteten Verteilung und die H0 wird abgewiesen