Eine (kurze) Einführung in G*Power - Björn Walther (2024)

Eine (kurze) Einführung in G*Power - Björn Walther (1)

G*Power ist ein kostenloses Tool der Uni Düsseldorf. Es dient primär zur Ermittlung der Mindeststichprobengröße für ein bestimmtes statistisches Analyseverfahren.

Inhaltsverzeichnis

1 Vorbemerkungen zu Inputparametern von G*Power

G*Power dient mir vor der Datenerhebung festzustellen, wie große meine Stichprobe mindestens sein muss.
Dazu muss ich im Vorfeld bereits folgendes wissen:

  • Hypothese
  • Untersuchungsmethode (abgeleitet aus der Hypothese)
  • Effektstärke (später mehr)
  • Alpha-Fehler-Niveau
  • Angestrebte statistische Power (= Teststärke)

1.1 Hypothese

Eigentlich ziemlich trivial, aber ohne Hypothese, weiß man ja gar nicht, was man untersucht. Deswegen bedarf es im Vorfeld einer (konzeptionellen) Herleitung der Hypothese(n). Hier unterscheidet man Zusammenhangshypothesen, Unterschiedshypothesen und Veränderungshypothesen. Die Art der Hypothese bestimmt die Untersuchungsmethode.

1.2 Untersuchungsmethode

  • Zusammenhangshypothesen untersucht man im ungerichteten Fall mit Korrelationsanalysen. Sind Zusammenhangshypothesen gerichtet, werden typischerweise Regressionsanalysen gerechnet.
  • Bei Unterschiedshypothesen werden Mittelwertvergleiche zwischen zwei (z.B. t-Test, U-Test) oder mehr (z.B. ANOVA, Kruskal-Wallis-Test) unabhängigen Gruppen gerechnet. Hat man nur zwei Gruppen, kann die Hypothese ebenfalls gerichtet sein.
  • Veränderungshypothesen haben eine größere Zahl an Analysemethoden, im einfachsten Fall sind es Mittelwertvergleiche mit einer (z.B. t-Test bei verbundenen Stichproben, Wilcoxon-Test) oder mehr als einer Messwiederholungen (z.B. ANOVA mit Messwiederholung, Friedman-Test)

1.3 Effektstärke

Im Vorfeld benötigt man die Effektstärke, also wie stark der beobachtete Effekt wohl sein wird bzw. vermutet wird. Hier orientiert man sich an den Größen nach Cohen (1988). Es gibt hierzu verschiedene Herangehensweisen zur Festlegung:

  • Der einfachste Weg ist eine Orientierung an Vergleichsstudien und Verwendung der dort angegebenen Effektstärke. Sollte keine angegeben sein, kann man die mitunter nachträglich mit den angegebenen Populationsparametern ermitteln.
  • Der praktische Weg ist das Festlegen auf Basis der Erfahrung des Forschers. Dies ist aber subjektiv und eine Begründung mit persönlicher Erfahrung kann bei Gutachtern schnell zu einer ablehnenden Haltung führen.
  • Der pragmatische Weg ist die Annahme eines mittleren Effektes. Auch hier ist eine Begründung notwendig und kann nicht einfach so getroffen werden – nicht selten findet man aber keine.

1.4 Alpha-Fehler

Der Alpha-Fehler (auch Fehler 1. Art) ist das fälschliche Ablehnen der Nullhypothese. Typisch ist als Grenze für Alpha 5% (0,05). Man akzeptiert also eine maximale Alpha-Fehlerwahrscheinlichkeit von 5%. Weitere typische Grenzen sind 1%, 0,1% oder sogar 10%. Achtung, es kommt hier häufig auf den Kontext an. Niedriger kann pauschal als besser erachtet werden – es geht ja um die Fehlervermeidung.

1.5 Statistische Power (Teststärke)

Teststärke (sog. statistische Power) beschreibt die Fähigkeit eines Tests, einen in der Stichprobe tatsächlich vorhandenen Effekt auch erkennen zu können und ist essenziell – nur leider ist das zu wenig bekannt. Die Power berechnet sich aus 1 abzüglich des Beta-Fehlers.
Der Beta-Fehler beschreibt das fälschliche Beibehalten der Nullhypothese. Hier kann man gut erkennen, dass Power und Beta-Fehler (auch Fehler 2. Art) direkt zusammenhängen. Ich erhöhe die Power, wenn ich den Beta-Fehler minimiere. Auch hier sind 5% Fehlerwahrscheinlichkeit erstrebenswert, somit ist die Power 1 – 0,05 = 0,95 (95%). Mehr ist kaum praktikabel. Als Kompromiss findet man als Untergrenze 0,8, also 80%. Eine geringere Power im Vorfeld anzunehmen, ist kaum rechtfertigbar.

2 Eingabe in G*Power

Eine (kurze) Einführung in G*Power - Björn Walther (2)
Das Fenster sieht recht nüchtern aus. Wichtig sind 3 Dinge:

2.1 Testfamilie und statistischer Test

Testfamilie ist die einem Test zugrunde liegende Verteilung. Wenn man dies nicht weiß, ist das kein Problem und man kann im oberen Reiter “Tests” das Verfahren direkt auswählen. Testfamilie und statistischer Test werden dann ausgefüllt.
Eine (kurze) Einführung in G*Power - Björn Walther (3)

2.2 Art der Poweranalyse

Hier gibt es verschiedene Möglichkeiten. Allen voran A priori sowie Compromise , Criterion, Post hoc und Sensitivity.
An dieser Stelle ist für die Planung der Mindeststichprobengröße A priori auszuwählen. Andere Verfahren sind eher unüblich. Besonders post hoc sollte nicht gerechnet werden, weil man sehr schnell in Versuchung gerät, falsche Schlüsse zu ziehen. Besonders beliebt ist eine niedrige Power für Nichtsignifikanz verantwortlich zu machen. Ein Fehlschluss, denn Power steigt mit sinkender Signifikanz des Tests bei konstanter Effektgröße. Aberson (2019): “[…] if we find that post hoc power is low, all we know is that the observed effect size was too small to be detected with the design we used.” Zhang et al. (2019) sowie viele weitere Autoren diskutieren post hoc Poweranalysen und warum man sie nicht rechnen sollte.

2.3 Inputparameter

Ich hatte bereits oben ein-/zweiseitige Tests, Effektstärke, Alpha-Fehler und Power erörtert. Entsprechend sind diese hier einzutragen. Unter Tails(s) steht “one” für einseitig, “two” entsprechend für zweiseitig.

Effect size ist je nach Verfahren eine andere. Im Beispiel ist es für den t-Test bei unabhängigen Gruppen Cohens d. Hält man die Maus auf dem Eingabefeld, werden via Tooltip die Grenzen noch mal eingeblendet.
Alpha-Fehler-Wahrscheinlichkeit ist die Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen und sollte aus Erfahrung nicht größer als 0,05 (5%) sein.

Power sollte möglichst groß sein, evtl. ist auch eine Power von 0,8 rechtfertigbar. Die Limitierung des Beta-Fehlers sollte aber im Vordergrund stehen, damit die Nullhypothese nicht fälschlicherweise beibehalten wird und ein vorhandener Effekt nicht erkannt wird. Findet man auch bei vergleichsweise niedriger Power eine Signifikanz, liegt das meist an einem hinreichend großen Effekt, also großer Effektstärke.

Bei manchen Tests sind zusätzlich noch andere Variablen wie Allocation ratio (Gruppenverhältnisse), df (degrees of freedom – Freiheitsgrade), Number of groups (Anzahl Gruppen), Number of covariates (Anzahl Kontrollvariablen), Number of predictors (Anzahl unabhängige Variablen) usw. anzugeben.

3 Outputparameter von G*Power

Je nach Testverfahren, wofür die Mindeststichprobengröße ermittelt wird, sieht der Output etwas anders aus. Für das Beispiel des t-Tests wird die Gesamtstichprobengröße noch mals für die jeweiligen Gruppen unterteilt angegeben. Wenn unter allocation ratio ein Wert verschieden von 1 angegeben wird, sind die Gruppengrößen entsprechend auch unterschiedlich.

Eine (kurze) Einführung in G*Power - Björn Walther (4)

4 Videotutorial

5 Literatur

  • Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York, NY: Psychology Press, Taylor & Francis Group
  • Zhang, Y., Hedo, R., Rivera, A., Rull, R., Richardson, S., & Tu, X. M. (2019). Post hoc power analysis: is it an informative and meaningful analysis?. General psychiatry, 32(4), e100069. https://doi.org/10.1136/gpsych-2019-100069
  • Aberson, C. L. (2019). Applied power analysis for the behavioral sciences. Speziell: https://books.google.de/books?id=qSiFDwAAQBAJ&lpg=PT14&pg=PT35#v=onepage&q&f=false
Eine (kurze) Einführung in G*Power - Björn Walther (2024)

FAQs

What is the G*Power statistical test? ›

G*power is a free statistical software that allows the user to determine statistical power based on a wide variety of tests. The user can specify the type of test being run, their desired level of power, and alpha level to determine the sample size needed.

Why use G power for sample size? ›

The null and alternative hypothesis, effect size, power, alpha, type I error, and type II error should be described when calculating the sample size or power. G*Power is recommended for sample size and power calculations for various statistical methods (F, t, χ2, Z, and exact tests), because it is easy to use and free.

Is G power a free software? ›

G*Power is a free software used to calculate statistical power. G*Power offers the ability to calculate power for a wide variety of statistical tests including t-tests, F-tests, and chi-square-tests, among others.

What is G*Power 3.1 software? ›

G*Power is a tool to compute statistical power analyses for many different t tests, F tests, χ2 tests, z tests and some exact tests.

What does G-Power do to BMW? ›

Gallery: BMW M3 Touring G-Power G3M Bi-Turbo

The most potent upgrade increases output to 720 hp and 626 lb-ft of torque. G-Power ups those figures with its Performance Software GP-720 upgrade and its complete DeepTone exhaust system, which reduces back pressure.

What does the G statistic tell us? ›

G Statistic. Perhaps the most straightforward measure of a goodness of fit is the G statistic, also refer to as the “likelihood ratio test.” It is a close analogue to the F statistic for linear regression. Both the F statistic and the G statistic measure a difference in deviance between two models.

What is an acceptable effect size? ›

Unlike the t-test statistic, the effect size aims to estimate a population parameter and is not affected by the sample size. SMD values of 0.2 to 0.5 are considered small, 0.5 to 0.8 are considered medium, and greater than 0.8 are considered large.

Why a bigger sample size is better? ›

The larger the sample size, the more accurate the average values will be. Larger sample sizes also help researchers identify outliers in data and provide smaller margins of error.

What is the minimum sample size power? ›

Before starting a study, you can use a power analysis to calculate the minimum sample size for a desired power level and significance level and an expected effect size. Traditionally, the significance level is set to 5% and the desired power level to 80%.

Who is the owner of G-POWER? ›

There are 2 promoter(s) of the company viz. Sachinkumar Vijaylal Jain, Rohit Sanjay Kumar, . G-POWER ENERGY & TECHNOLOGY PRIVATE LIMITED Annual General Meeting (AGM) was last held on 30-09-2021 as per records from the Ministry of Corporate Affairs (MCA).

Is G-POWER owned by BMW? ›

History. The history of G-POWER began in 1971 in Neu-Isenburg near Frankfurt with the Grommisch family with the refinement of vehicles of the BMW brand. In 1973 the company took over the distribution of the Alpina agency in the Rhine / Main area. From 1983, the focus was on the core business, BMW tuning with G-POWER.

Who invented G*Power? ›

G*Power (Erdfelder, Faul, & Buchner, 1996) was designed as a general stand-alone power analysis program for statistical tests commonly used in social and behavioral research.

Where can I download G*Power? ›

Downloading and Installing G*Power: Windows/PC
  • Navigate to the G*Power website.
  • Scroll down to the “DOWNLOAD” section.
  • There are two download options: Windows and Mac. Choose the appropriate link to begin your download.
May 29, 2024

What does G-power stand for? ›

The G-POWER brand stands for performance, passion and a relentless desire to be the best. By uniting innovative technologies and high-quality materials with our attention to detail and a dynamic, stylish design language, we develop products that inspire. Products of the highest quality don't come about by chance.

What is effect size in g-power? ›

Effect size: magnitude of the effect under the alternative hypothesis. • The larger the effect size, the easier it is to detect an effect and require. fewer samples. Power: probability of correctly rejecting the null hypothesis if it is false. • AKA, probability of detecting a true difference when it exists.

What is G in hypothesis testing? ›

To study the use of G–test of goodness-of-fit (also known as the likelihood ratio test, the log-likelihood ratio test, or the G2 test) when you have one nominal variable. To see whether the number of observations in each category fits a theoretical expectation, and the sample size is large.

What is the statistical test of power? ›

Statistical power, or the power of a hypothesis test is the probability that the test correctly rejects the null hypothesis. That is, the probability of a true positive result. It is only useful when the null hypothesis is rejected.

What is the most powerful statistical test? ›

The use of the LRT is justified by the Neyman-Pearson lemma, which states that the LRT is the most powerful test to compare two simple hypotheses, e.g. H0: θ = 0 and Ha: θ = 2.

What is effect size f in g power? ›

The f effect size statistic, used by G*Power, is the standardized average dispersion among the group means. Cohen also proposed the delta (δ) ANOVA effect size statistic, which is the difference between the largest and smallest population means divided by the within-population standard deviation.

Top Articles
Latest Posts
Article information

Author: Eusebia Nader

Last Updated:

Views: 6155

Rating: 5 / 5 (80 voted)

Reviews: 95% of readers found this page helpful

Author information

Name: Eusebia Nader

Birthday: 1994-11-11

Address: Apt. 721 977 Ebert Meadows, Jereville, GA 73618-6603

Phone: +2316203969400

Job: International Farming Consultant

Hobby: Reading, Photography, Shooting, Singing, Magic, Kayaking, Mushroom hunting

Introduction: My name is Eusebia Nader, I am a encouraging, brainy, lively, nice, famous, healthy, clever person who loves writing and wants to share my knowledge and understanding with you.