Jednostranná varianta z-testu

  Excel, Statistika

U oboustranného z-testu byla alternativní hypotéza zadaná nerovností, tj. alternativní hypotéza tvrdila, že střední hodnota náhodného výběru je odlišná od teoretické (testované) střední hodnoty. Nyní rozebereme zbývající dvě varianty testu – levostranný a pravostranný.

Budeme nadále testovat, zda se střední hodnota délky součástky rovná či nerovná 190 mm. Teoreticky mohou nastat tři situace:

  1. střední hodnota délky součástky je přesně 190 mm (tj. \(\mu = 190 \, \mathrm{mm}\)),
  2. střední hodnota délky součástky je menší než 190 mm (tj. \(\mu < 190 \, \mathrm{mm}\)),
  3. střední hodnota délky součástky je větší než 190 mm (tj. \(\mu > 190 \, \mathrm{mm}\)).

Pokud je výsledek našeho testování správný, pak v první situaci \(H_0 \) nezamítneme a ve druhé a třetí situaci hypotézu \(H_0 \) zamítneme.

Představme si ale, že bychom mohli druhou nebo třetí situaci předem vyloučit. Uvažujme například, že zařízení nedovolí dělníkovi zadat vyšší hodnotu než 190 mm. Zbývající variantu neuvažujeme, tj. rozhodujeme se pouze mezi první a druhou variantou. V takovém případě můžeme použít jednostranný test.

Levostranný z-test

Pro přehlednost napíšu znovu celé zadání příkladu: Máme zařízení, které vyrábí součástku určité délky. Směrodatná odchylka délky součástek v důsledku chybovosti zařízení je 0,9 mm a odchylky mají normální rozdělení. Požadovaná délka součástky je 190 mm. Pracovník nemůže zadat k výrobě delší součástku, v důsledku chybného zadání ale mohou být vyráběny kratší součástky. Ověřte, zda bylo zařízení správně nastaveno.

Naše hypotézy jsou nyní následující

  • \(H_0: \mu = 190 \, \mathrm{mm} \). (Slovně: Střední hodnota statistického souboru je 190 mm.)
  • \(H_1: \mu < 190 \, \mathrm{mm} \). (Střední hodnota statistického souboru je menší než 190 mm.)

Statistika testu zůstává stejná:

\(Z = \frac{\bar{x} – \mu_0}{\sigma} \sqrt{n} \, ,\)

přičemž \(\bar{x}\) je průměr našeho vzorku, \(\mu_0\) je teoretická (testovaná) střední hodnota, \(\sigma\) je směrodatná odchylka základního souboru a \(n\) je rozsah náhodného výběru. Statistika má opět normované normální rozdělení.

Tip

V případě statistických testů obecně platí, je oboustranné i jednostranné varianty mají stejný vzorec pro statistiku, ale liší se jich kritické obory.
U jednostranných testů není kritický obor rozdělený na dvě části, ale nachází se kompletně (v závislosti na alternativní hypotéze) v levé nebo pravé části statistiky – podle toho, kam „ukazuje“ znaménko u alternativní hypotézy.

Kam umístit kritický obor

Naše alternativní hypotéza \( H_1 \) tvrdí, že skutečná střední hodnota je menší než 190 mm. Jestliže \( H_1 \) platí, pak bude s větší pravděpodobností průměr vzorku menší než 190. Nižší hodnota \(\bar{x}\) než 190 znamená, že rozdíl \(\bar{x} – \mu_0\) je záporný. Protože \(\sigma\) a \(n\) jsou vždy kladné, záporná hodnota tohoto rozdílu znamená, že i hodnota statistiky je záporná. Z toho plyne, že záporné hodnoty statistiky hovoří spíše ve prospěch alternativní hypotézy. Čím je hodnota statistiky menší, tím větší tendenci máme k zamítnutí nulové hypotézy.

Proto se kritický obor se nachází v levé části souřadnicové osy. Z toho důvodu označujeme test jako levostranný.

Poznámka

Tato úvaha je značně abstraktní a složitá na pochopení. Nic se neděje, pokud ji nepochopíte ihned. Princip je však stejný u dalších testů a postupně si jej odvodíte.

Hladina významnosti a možné závěry

Kritické obory pro hladinu významnosti \(\alpha = 5 %\), \(\alpha = 1 % \) a \(\alpha = 10 % \) naleznete na obrázku níže.

Je důležité si uvědomit, že plocha kritického oboru je stále \( 0{,}05 \). To způsobuje hranice kritického oboru (kritická hodnota) pro stejnou hladinu významnosti je „více vpravo“ oproti kritickému oboru oboustranného testu (porovnejte si to s kritickými obory u oboustranného z-testu).

Naše testování můžeme ukončit dvěma závěry:

  • Zamítneme \(H_0\) a na dané hladině významnosti prohlásíme, že střední hodnota délky součástky je nižší než 190 mm, tj. zařízení bylo nastaveno chybně. Jinak řečeno, přijímáme alternativní hypotézu.
  • Nezamítáme \(H_0\) na dané hladině významnosti, tj. nepodařilo se nám prokázat, že by délka součástky byla nižší než 190 mm.

Upozornění

Druhou variantu výsledku ale nemůžeme interpretovat jako prokázání nulové hypotézy. Při testování hypotéz můžeme prokázat pouze platnost alternativní hypotézy. V případě nezamítnutí \(H_0\) totiž neznáme pravděpodobnost pravdivosti tohoto výroku, tj. neznáme sílu testu. Ta závisí na skutečné hodnotě délky základního souboru (kterou samozřejmě neznáme). Extrémně malé chyby (např. \(\mu = 189{,}99 \, \mathrm{mm} \) na vzorku o rozsahu \(n = 20\) bychom s velkou pravděpodobností neodhalili.

Výpočet z-testu v Excelu

Podívejme se nyní, jak by se z-test provedl v aplikaci Microsoft Excel. Testovat budeme na \(\alpha = 5 %\). Využijeme list, který jsme použili pro oboustranný test, provedeme pouze několik modifikací.

z-test left

Máme pouze jednu hranici kritického oboru, která je daná vzorcem

=NORM.S.INV(D6)

Kritický obor vyjádřený intervalem má tvar:

\(W = u_{0,05} = ( – \infty, -1,6449 \rangle \, , \)

kde \(u_{0,05} \) označujeme pětiprocentní kvantil normovaného normálního rozdělení. Dále upravíme vzorec pro výpočet p-hodnoty

=NORM.S.DIST(D9;PRAVDA)

Hodnota statistiky je -2,0020, tj. statistika leží v kritickém oboru. V tomto případě tedy můžeme konstatovat, že jsme na hladině významnosti $\latex \alpha = 5 %$ prokázali, že střední hodnota délky součástky je menší než 190. Zařízení tedy bylo nastaveno chybně.

Výsledek potvrzuje i p-hodnota, která je nižší než hladina významnosti. Porovnání je na obrázku níže. p-hodnota je plocha pod hustotou statistiky od minus nekonečna až po vypočtenou hodnotu statistiky.

K provedení testu můžeme využít i funkci Z.TEST. Tato funkce standardně vrací p-hodnotu pravostranného testu. Protože my provádíme levostranný test, p-hodnotu získáme odečtením výsledku funkce Z.TEST od jedničky.

=1-Z.TEST(A1:A20;D5;D4)

Pokud bychom odečtení od jedničky neprovedli, získali bychom plochu zelené oblasti na obrázku níže. Protože provádíme levostranný test, chceme znát plochu pod funkcí hustoty nalevo od hodnoty statistiky. Ta je na obrázku vyznačena modře.

z-test-excel-oneside-expl

Pravostranný z-test v Excelu

Nyní uvažujme opačný případ, tj. pracovník nemůže nastavit délku nižší než 190 mm. V takovém případě máme následující hypotézy:

  • \(H_0: \mu = 190 \, \mathrm{mm} \). (Slovně: Střední hodnota statistického souboru je 190 mm.)
  • \(H_1: \mu > 190 \, \mathrm{mm} \). (Střední hodnota statistického souboru je větší než 190 mm.)

Vzorec pro statistiku testu zůstává stejný:

\(Z = \frac{\bar{x} – \mu_0}{\sigma} \sqrt{n} \, .\)

Kritický obor se nyní nachází vpravo.

Výpočet z-testu v Excelu

Budeme opět testovat na \(\alpha = 5 %\). Oproti předchozímu testu máme jinou hranici kritického oboru, která je daná vzorcem

=NORM.S.INV(1-D6)

Protože normované normální rozdělení je symetrické kolem nuly, je kritická hodnota v absolutní hodnotě stejná jako u předchozí varianty, liší se ale znaménkem.

Kritický obor vyjádřený intervalem má tvar:

\(W = u_{0,95} = \left( – \infty, 1,6449 \right\rangle \, , \)

kde \(u_{0{,}95} \) označuje 95%ní kvantil normovaného normálního rozdělení. Průběh testu vidíte na obrázku níže. Na \(\alpha = 5 %\) nulovou hypotézu nezamítáme.

Capture2

Protože funkce Z.TEST standardně provádí právě pravostranný test, je její použití jednoduché:

=Z.TEST(A1:A20;D5;D4)

Další možností je získání výsledku pomocí distribuční funkce normálního rozdělení. p-hodnotu nyní tvoří plocha vpravo od hodnoty statistiky. K získání p-hodnoty tedy odečteme hodnotu distribuční funkce od jedničky.

=1-NORM.S.DIST(D9,PRAVDA)

Výsledek si můžeme zobrazit i graficky.

Nepodařilo by se nám tedy prokázat, že by byl stroj chybně nastaven.

Poznámka

Nyní si ještě jednou ukážeme, proč bychom se měli výroku o pravdivosti nulové hypotézy vyhnout. Jak ukazuje obrázek níže, střední hodnota dat byla ve skutečnosti o něco vyšší než 190 mm, konkrétně 190,05 mm. Takto malou chybu se nám tedy nepodařilo odhalit.

Capture

Excel soubor s testem je zde: z-test data.

LEAVE A COMMENT