# *English version* This section covers the base and implementation of hypothesis testing. ## Base When performing a study it is not possible to include the entire population of your interest, therefore only a [[Sample|sample]] of the population is included. The [[Measures of central tendency and dispersion| descriptive results]] of the sample by itself cannot conclude on accepting or rejecting the hypothesis. It could be that results in the sample are merely occuring by chance. To make an inference from the sample to the population [[Inferential statistics| inferential statistics]] is required, which considers the probability that a result in the sample is due to chance ([[Significance | significance]]) >*For example:* >You have the following hypothesis: Muscle mass increases more when performing strength training compared to performing endurance training >---------- >The results are as follows: >- Average muscle mass gain after strength training: 0.9kg >- Average muscle mass gain after endurance training: 0.6kg > > Based on this information it can be said that muscle mass gain **in the sample** is higher after strength training compared to endurance training. However, based on this information it CANNOT be inferred to the **population**. It could be that by chance the sample in the strength training group has an above average muscle synthesis rate. Your resulty would then not reflect the typical relationship between independent and dependent variable but a very unlikely extreme case. > Statistical tests serve to calculate the probability the your observed difference in muscle mass results occur even though in the population, your hypothesis does not hold. This exapmle shows that the measures used in [[Measures of central tendency and dispersion|descriptive statistics]] are not enough to conclude that the hypothesis holds. The results from the sample can origin from (bad) luck and might not correspond to the real relationships in the population, the sample was drawn from. The [[Inferential statistics]] serves to calculate for the probability that a certain result occurs although the conditions do not hold for the population. Based on the result of the inferential statistics and the level of significance, the [[Statistical hypothesis#Types of hypothesis|null hypothesis]], which corresponds to the assumption that our research hypothesis is wrong is either rejected or not. ## One-sided and two-sided tests Based on the type of hypothesis, either one-sided tests or two-sided tests are used. In case of a [[Hypothesis#Directed vs Undirected|directed hypothesis]] an one-sided test is used. In case of an [[Hypothesis#Directed vs Undirected|undirected hypothesis]] a two-sided test is used. ![[1-2-Seitige Tests.png]] **a. Rejection area for two-sided tests** [[Type I and type II errors#Type I error|Alpha]] indicates the level of [[Significance|significance]]. Because the expectance of the relation between variables is unknown, either positive or negative, alpha is divided by equally over the negative and positive site of the distribution. The respective t-values are the border at which a result is deemed significant. **b. Rejection area for one-sided tests** Again, alpha indicates the level of significance and is equal to alpha in a. However, because the expectenance of the relation is expressed, in this case positive, alpha is at the positive site of the distribution only. The respective t-value is the border at which a result is deemed significant. It is important that the appropriate sided-test is applied to prevent either inflation of the type I error or decrease in [[Type I and type II errors#Type II error|power]]. ## Interpretation As previously mentioned to be reject or accept your hypothesis, inferential statistics are required. Statistical programs, such as SPSS and R can be used to do so. More information about specific statistical tests and how its output is interpreted can be found in the folder statistics. ________________________ _______________________ --- # *German version* # Hypothesentests Dieser Artikel stellt eine Einführung in hypothesenprüfende Verfahren dar und beschäftigt sich mit den Grundlagen ihrer Anwendung. Die einzelnen statistischen Testverfahren werden im Ordner *Statistics* ausführlicher dargestellt. Wenn Sie nach einem geeigneten Test für eine konkrete [[Hypothesis|Hypothese]] suchen, empfiehlt es sich bei den [[8. Statistic Tests| statistischen Tests]] zu beginnen. ___ ## Einführung Für die empirische Forschung steht in der Regel nicht die gesamte Population für eine Untersuchung zur Verfügung. Meist können Erhebungen nur an einem Teil der Population ([[Sample|Stichprobe]]) durchgeführt werden. Daraus ergibt sich das Problem, dass die erhobenen Werte zunächst nur die Stichprobe beschreiben. Um anhand der Ergebnisse Aussagen über die Population treffen zu können, braucht man geeignete statistische Testverfahren. Dies lässt sich an folgendem Beispiel veranschaulichen. > Ihre Hypothese lautet: *Mit Krafttraining lässt sich mehr Muskelmasse aufbauen als mit Ausdauertraining*. >___ > Zur Überprüfung Ihrer Hypothese lassen Sie eine Gruppe von Probanden regelmäßig ein Krafttraining absolvieren und die andere Gruppe regelmäßiges Ausdauertraining. > Am Ende Ihrer Intervention bekommen Sie folgendes Ergebnis: <br> > durchschnittlicher Muskelzuwachs Krafttraining: 0,9 kg > durchschnittlicher Muskelzuwachs Ausdauertraining: 0,6 kg > <br> > Ihre Ergebnisse zeigen zwar, dass Ihre Hypothese für Ihre Stichprobe gültig ist, allerdings können Sie aus den Ergebnissen nicht schließen, ob sie auch für die Population gelten. > Es wäre z. B. denkbar, dass Sie in Ihrer Stichprobe überdurchschnittlich viele Individuen hatten, bei denen Krafttraining zu besonders viel Muskelwachstum führt. Ihre Ergebnisse würden in diesem Fall nicht die Realität abbilden, sondern einen unwahrscheinlichen Extremfall. > Mit einem statistischen Test können Sie überprüfen wie hoch die Wahrscheinlichkeit dafür ist, dass sie zu Ihrem Ergebnis gekommen sind, obwohl es in der Population nicht gilt. Wie dieses Beispiel zeigt, lässt sich anhand von Maßen der [[Measures of central tendency and dispersion|deskriptiven Statistik]] (wie dem Mittelwert) alleine noch nicht schließen, ob die Hypothese gilt oder nicht. Die Ergebnisse könnten z. B. auch rein zufällig entstanden sein und nicht den Werten der Population entsprechen. Die Wahrscheinlichkeit dafür, dass ein bestimmtes Forschungsergebnis auftritt, obwohl es in der Population nicht zutrifft, wird mittels statistischer Tests ermittelt. Man bezeichnet diese auch als **Signifikanztests** (vgl. [[Inferential statistics|schließende Statistik]]). <br> > Mithilfe von Signifikanztests wird geprüft, mit welcher Wahrscheinlichkeit die gefundene (bzw. noch extremere) Ergebnisse auftreten können, wenn die [[Statistical hypothesis#Nullhypothese|Nullhypothese]] gilt. Ergebnisse die auf diese Art gewonnen werden sind demnach auch keine deterministischen Aussagen, sondern Wahrscheinlichkeitsaussagen (probabilistische Aussagen). ## Ein- und zweiseitige Tests Man unterscheidet bei den Hypothesentests zwischen einseitigen und zweiseitigen Testverfahren. Zur Überprüfung von ungerichteten Hypothesen verwendet man **zweiseitige Tests** und bei gerichteten Hypothesen **einseitige Tests** (vgl. [[Hypothesis#Hypothesenarten|Hypothesenarten]]). ![[1-2-Seitige Tests.png]] **a) Ablehnungsbereich für einen zweiseitigen t-Test** Die Werte t<sub>(α/2)</sub> und - t<sub>(α/2)</sub> markieren die t-Werte eine t-Verteilung ab denen die Wahrscheinlichkeit, dass diese Werte auftreten, obwohl die H<sub>0</sub> gilt, gleich α% ist. Ergebnisse in diesem Bereich führen daher zur Annahme der Alternativhypothese. **b) Ablehnungsbereich für einen einseitigen t-Test** Werte die größer sind als t<sub>(α)</sub> führen dazu, dass die Nullhypothese verworfen wird. <br> ## Interpretation Die letztendliche Entscheidung, welche Hypothese man annimmt bzw. ablehnt wird auf Basis des **p-Wert** (p für engl. probability) getroffen-. Liegt dieser Wert über dem vorher festgelegten Signifikanzniveau wird die Alternativhypothese verworfen. **Sollte die Alternativhypothese jedoch nicht bestätigt werden, bedeutet dies nicht, dass die Nullhypothese gilt.** Denn bei einem nichtsignifikanten Ergebnis wird lediglich nachgewiesen, dass die Annahme von H<sub>1</sub> mit einer über das Signifikanzniveau hinausgehenden Irrtumswahrscheinlichkeit verbunden ist, was uns dazu veranlasst, nicht zugunsten von H<sub>1</sub> zu entscheiden. > Das Ergebnis eines Signifikanztests hängt auch von der Hypothesenart und dem vorher gewählten Signifikanzniveau ab. > Daher gilt: > **Signifikanzniveau und Hypothesenformulierung sollten vor der Untersuchung unveränderlich festgelegt werden** ___ Vertiefende Informationen finden Sie unter: https://link.springer.com/chapter/10.1007/978-3-540-33306-7_8