Fundamentals of Statistics

Dvouvýběrový pravostranný t-test

Nyní si ukážeme postup při pravostranném testu. Upravme si nejprve předchozí zadání: Máme data o průměrném počtu výrobků, které neprošly kontrolou kvality (tj. zmetků), vyrobených ve dvou různých závodech, přičemž druhý závod postupuje podle upravených výrobních procesů. Předpokládáme, že počty mají v obou případech shodný rozptyl. Ověřte hypotézu, že změna výrobních postupů vedla ke snížení zmetkovosti.

Hypotézy našeho testu jsou následující:

\( H_0: \mu_{X_1} = \mu_{X_2} \, .\) (Střední hodnota obou souborů je stejná.)
\( H_1: \mu_{X_1} < \mu_{X_2} \, .\) (Střední hodnota prvního souboru je vyšší.)

Statistika testu zůstává stejná, kritický obor se přesunuje doprava, tj.:

\( W = \langle t_{1-\alpha} (n_1 + n_2 - 2) \infty ) \)

dvouvýběrový t-test data pravostranný

Soubor se všemi výpočty naleznete zde.

Výpočet s využitím doplňku Analýza dat

Výpočet spustíme pomocí stejného postupu, jako jsme si uvedli výše, tj. označíme oblasti s daty a výstupní oblast. Níže máme výsledek výpočtu. Hodnota statistiky je \( T = - 0{,}8626\) a tentokrát máme správně určenou i hranici kritického oboru, kritický obor je tedy

\( W = \langle 1{,}6663, \infty ) \, .\)

dvouvýběrový t-test pravostranný analýza dat

Špatně je ale p-hodnota. Hodnota statistiky je záporná a protože kritický obor určujeme zprava, musí být p-hodnota vyšší než \( 0{,}5\). Dochází zde tedy k problému, který jsme si popisovali výše. Tato p-hodnota by byla správná v případě levostranného testu. V případě pravostranného testu je ale \( 1 - 0{,}1956 = 0{,}8044\).

Porovnání p-hodnot je na grafu níže. Červeně je označena p-hodnota levostranného testu, zeleně p-hodnota pravostranného.

dvouvýběrový t-test porovnání p-hodnot

Využití funkce T.TEST

Podobně jako Analýza dat, i funkce T.TEST v jednodušší variantě vrací chybný výsledek. Pří použití následujícího vzorce

T.TEST(A2:A41;B2:B35;1;2)

získáme hodnotu \( 0{,}1956\), který by byla správná, pokud bychom dělali levostranný test.

Použijme tedy opět funkci podmínky. Tento vzorec je stejný jako výše s výjimkou znaménka u podmínky, které je obráceně.

=KDYŽ(E3>F3;T.TEST(A2:A41;B2:B35;1;2);1-T.TEST(A2:A41;B2:B35;1;2))

Manuální výpočet

Vzorec pro výpočet statistiky zůstává stejný, proto rovnou přejdeme k dalším krokům.

Kritický obor tentokrát určujeme zprava. Do kritického oboru budou patřit nejvyšší hodnoty z definičního oboru tak, že pravděpodobnost, že testová statistika nabude těchto hodnot, bude přesně \( \alpha\), v našem případě \( \alpha = 0{,}05\). Zbylé hodnoty, u nichž je tato pravděpodobnost \( 1 - \alpha = 1 - 0{,}05 = 0{,}95\), jsou mimo kritický obor. Jak první parametr inverzní distribuční funkce Studentova rozdělení T.INV tedy zadáme \( 1 - \alpha\), ostatní se nemění:

=T.INV(1-E7;E2+F2-2)

Kritický obor je tedy:

\( W = \langle 1{,}6663, \infty) \).

p-hodnotu určíme pomocí funkce T.DIST a to opět směrem doprava, tj:

=1-T.DIST(E12;E2+F2-2;PRAVDA)

Můžeme rovněž použít pravostrannou distribuční funkci T.DIST.RT, která nám zápis trochu zjednoduší:

=T.DIST.RT(E12;E2+F2-2)