Welchův t-test

  Excel, Statistika

Welchův test používáme pro soubory, jejichž pozorování nejsou spárována a nemůžeme u nich předpokládat shodný rozptyl. V některých učebnicích statistiky je doporučeno začít s ověřením hypotézy o shodě rozptylů pomocí Fischerova testu a dle výsledku poté zvolit variantu t-testu. Tento postup však není korektní.

Levostranný Welchův t-test

Abychom si ještě jednou ukázali odlišnost Welchova testu, vyjdeme ze zadání z předchozích dvou článku: Máme data o průměrném počtu vyrobených výrobků pracovníky ve dvou různých závodech, přičemž v jednom ze závodů jsou testovány nové výrobní procesy. Vedení společnosti potřebuje ověřit, zda nové výrobní postupy zvýšily produktivitu práce. Ověřte na \( \alpha = 5 % \) hypotézu, že v závodě s novými výrobními postupy vyrobí pracovníci v průměru více výrobků, než v závodě s původními postupy, přičemž předpokládáme, že rozptyly průměrného počtu výrobků se mohou lišit. Vedení v minulosti statisticky ověřilo, že před změnou procesů byli pracovníci v obou závodech v průměru stejně výkonní.

Data jsou v tabulce níže

Závod 1199.98214200.02066200.02763199.95948199.99668200.01018199.99315199.97664200.01485199.96795199.92523200.02216200.03065200.01761200.01264200.08308199.99550200.00041199.99517200.02942
Závod 2200.04822200.08817200.04806200.01402200.03498199.92516200.09787200.10234199.95363200.01334199.97706200.01043199.96209199.91984200.08773200.04719199.98357

Opět zavedeme značení: \( X_1 \) obsahuje pozorování ze závodu se starými postupy a soubor \( X_2 \) pozorování ze závodu s upravenými postupy. Příslušné střední hodnoty pak označíme \( \mu_{X_1} \) a \( \mu_{X_2} \). Nyní můžeme formulovat nulovou a alternativní hypotézu:

  • \( H_0: \mu_{X_1} = \mu_{X_2} \) (Střední hodnota obou souborů je stejná.)
  • \( H_1: \mu_{X_1} < \mu_{X_2} \) (Střední hodnota prvního souboru je nižší.)

Statistiku testu vypočteme dle vzorce

\( T = \frac{\bar{X_1} – \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \, , \)

kde \( \bar{X_1} \) a \( \bar{X_2} \) značí průměry, \( s_1^2 \) a \( s_2^2 \) výběrové rozptyly a \( n_1 \) a \( n_2 \) počty pozorování. Statistika má opět Studentovo (t) rozdělení. Poměrně složitý je tentokrát určení počtů stupňů volnosti, proto se ručnímu výpočtu vyhneme a provedeme výpočet pouze pomocí Analýzy dat a funkce T.TEST.

Výpočet pomocí doplňku Analýza dat

V Analýze dat tentokrát volíme možnost Dvouvýběrový t-test s nerovností rozptylů.

Do polí 1. soubor a 2. soubor vybereme oblasti s daty. Vybereme-li oblasti včetně záhlaví, zaškrtneme pole Popisky. Dále označíme Výstupní oblast a stiskneme tlačítko OK.

Na obrázku níže vidíme výsledky.

Protože provádíme levostranný test, zajímají nás označené řádky. Hodnota statistiky je tedy \( T = -0{,}9650 \). Kritický obor se nachází vlevo, proto vezmeme hranici z řádku t krit (1) a přidáme k ní tlačítko minus. Kritický obor tedy leží v intervalu \( W = \left( – \infty, -1{,}7109 \right\rangle \). P-hodnota testu je \( 0{,}1721 \). P-hodnota skutečně odpovídá naší variantě testu. Protože p-hodnota je vyšší než hladina významnosti, nezamítáme \( H_0 \).

Poznámka

Statistika testu je totiž záporná a tím pádem musí být p-hodnota menší než \( 0{,}05\).

Výpočet pomocí funkce T.TEST

Funkce T.TEST (ve starších verzích TTEST) vrací p-hodnotu testu. Prvními dvěma parametry jsou soubory s daty. Třetím parametrem je varianta testu (oboustranný nebo jednostranný), zadáváme tedy 1. Posledním parametrem volíme, zda se jedná o párový t-test (1), Studentův t-test (2) nebo Welchův test (3).

=T.TEST(A2:A21,B2:B18,1,3)

Pro naše data vrací funkce hodnotu \( 0{,}1721 \), na základě toho bychom tedy nezamítli \( H_0 \).

Obecná funkce pro levostranný test

Funkce T.TEST funguje na podobném principu jako výpočet p-hodnoty u Analýzy dat, tj. vrací menší z možných dvou p-hodnot. Teoreticky by se mohlo stát, že by hodnota statistiky byla vyšší než 0 a tím pádem by p-hodnota testu byla vyšší 0,5. Funkce T.TEST však vrací vždy p-hodnotu menší než 0,5, tj. vracela by p-hodnotu pro pravostranný test. Rozhodnutí můžeme opět provést na základě hodnoty statistiky a pomocí funkce KDYŽ:

=KDYŽ(E8<0,T.TEST(A2:A21,B2:B18,1,3),1-T.TEST(A2:A21,B2:B18,1,3))

Samotný vzorec pro výpočet statistiky je

=(E3-F3)/ODMOCNINA(E4/E2+F4/F2)

Pravostranný Welchův test

Uvažujme nyní, že máme obdobné zadání, máme však data o průměrné době potřebné na výrobu jednoho výrobku. Pokud by technologické postupy v novém závodě byly efektivnější, průměrná doba výroby by měla být nižší. Data jsou v tabulce níže.

Závod 144.6926745.6931544.4200644.4923344.7645145.7127845.2622944.9635445.3220743.9909545.6470645.1331144.8832245.7685543.9543445.4327845.2994744.999645.7697945.3854745.8857444.6847744.8806345.0617645.37277
Závod 244.2222644.7857244.3983845.0841544.8070644.0352944.1906845.1552843.9941944.7981943.951344.9269744.9748845.4399544.4993744.8181345.61444.5157843.9089844.1507643.7836144.3313344.36244.2276544.0114945.0100444.2919

Modifikujeme alternativní hypotézu a získáme dvojici hypotéz:

  • \( H_0: \mu_{X_1} = \mu_{X_2} \)
  • \( H_1: \mu_{X_1} > \mu_{X_2} \)

Hladina významnosti je stále \( \alpha = 5 % \).

Výpočet pomocí doplňku Analýza dat

Postup výpočtu je naprosto stejný jako u levostranného testu. Pro aktuální data máme výstup na obrázku níže.

Hodnota statistiky je nyní \( T = 3{,}9928 \). Kritický obor se nachází vpravo, proto hranici najdeme v řádku t krit (1) a tentokrát ji nijak neupravujeme. Kritický obor tedy leží v intervalu \( W = \left\rangle 1{,}6766 , \infty \right) \). Vidíme, že statistika lež v kritickém oboru. p-hodnota testu je \( 0{,}0001 \), zamítáme tedy \( H_0 \). Na \( \alpha = 5 % \) jsme prokázali, že výroba ve druhém závodě je rychlejší.

Výpočet pomocí funkce T.TEST

Zápis funkce je opět stejný, tj.:

=T.TEST(A2:A26,B2:B28,1,3)

Funkce vrací p-hodnotu testu, což je \( 0{,}0001\). Nulovou hypotézu bychom opět zamítli.

Pokud bychom opět chtěli obecný vzorec, který si poradí i s p-hodnotami vyššími než 0,5, upravíme jej o podmínku na základě hodnoty statistiky:

=KDYŽ(E8>0,T.TEST(A2:A26,B2:B28,1,3),1-T.TEST(A2:A26,B2:B28,1,3))

Oboustranný Welchův test

V případě oboustranného testu řešíme pouze to, zda je mezi středními hodnotami rozdíl. Vraťme se k našemu příkladu s počty vyrobených výrobků ve dvou různých závodech. Nyní tedy rozhodneme „pouze“ o tom, zda se průměrné počty mezi závody liší.

Naše hypotézy jsou nyní:

  • \( H_0: \mu_{X_1} = \mu_{X_2} \) (Střední hodnota obou souborů je stejná.)
  • \( H_1: \mu_{X_1} \neq \mu_{X_2} \) (Střední hodnota prvního souboru je nižší.)

Data z obou závodů jsou v tabulce níže.

Závod 1190.53082190.70691190.68514189.32068189.93107189.65363189.62920190.15749189.88063190.15778189.86708190.81115190.35090189.60921190.38187190.85053189.79748189.90501################
Závod 2190.51846191.86783191.71020189.71007189.79866190.82983191.09171190.59191190.10827190.59553190.91844190.10630190.16401190.00247190.19419190.20659190.03263190.37341########################################################

Test opět provedeme na hladině významnosti \( \alpha = 5 % \).

Výpočet pomocí doplňku Analýza dat

Test spustíme pomocí stejného postupu jako v ostatních variantách. Hodnota statistiky testu je \( T = -2{,}0854 \). p-hodnotu a hranici kritického oboru nyní najdeme v posledních dvou řádcích. p-hodnota testu je \( 0{,}0430 \). Kritický obor je v případě oboustranného testu rozdělen na dvě části. Analýza dat nám vrací dolní hranici pravé části, horní hranici levé získáme, když před danou hranici napíšeme 0. Kritický obor je tedy \( W = \left( -\infty, – 2{,}0167 \right\rangle \cup \left\langle 2{,}0167, \infty \right) \).

Statistika tedy leží v kritickém oboru a p-hodnota je nižší než hladina významnosti, na \( \alpha = 5 % \) tedy zamítáme \( H_0 \). Tentokrát jsme však pouze prokázali, že mezi výkonností závodů existuje rozdíl, nelze však tvrdit, že v druhém závodě je výkonnost vyšší.

Výpočet pomocí funkce T.TEST

V případě oboustranného testu zadáváme na třetí pozici číslo 2, díky čemuž nám funkce T.TEST vrátí p-hodnotu oboustranného testu. V našem případě to je tedy hodnota \( 0{,}0430 \).

=T.TEST(A2:A21,B2:B26,2,3)

V případě oboustranného testu je vrácená hodnota vždy správná a funkci již nemusíme nijak upravovat.

LEAVE A COMMENT