Category : Statistika

Často je třeba porovnat několik statistických souborů vůči sobě. To znamená, že například u dvou souborů zjišťujeme, jestli některý z nich nemá větší střední hodnotu nebo rozptyl než ten druhý. Pro takový typ úloh budeme používat testy, které jsou navržené na práci s více soubory. Začneme s dvouvýběrovými testy, tj. testy, které porovnávají právě dva ..

Read more

Možné případy chyb a správných výsledků se často znázorňují v tabulce. Ve sloupcích vidíme skutečnost (kterou neznáme) a v řádcích výsledek našeho testování. Hypotézu nezamítáme Hypotézu zamítáme Hypotéza platí Správný výsledek (pravděpodobnost ) Chyba 1. druhu (pravděpodobnost ) Hypotéza neplatí Chyba 2. druhu (pravděpodobnost ) Správný výsledek (pravděpodobnost ) Celkem tedy mohou nastat dva případy, ..

Read more

Levostranný Welchův t-test Abychom si ještě jednou ukázali odlišnost Welchova testu, vyjdeme ze zadání z předchozích dvou článku: Máme data o průměrném počtu vyrobených výrobků pracovníky ve dvou různých závodech, přičemž v jednom ze závodů jsou testovány nové výrobní procesy. Vedení společnosti potřebuje ověřit, zda nové výrobní postupy zvýšily produktivitu práce. Ověřte na  hypotézu, že v závodě ..

Read more

V minulém článku jsme otevřeli problematiku dvouvýběrových testů, tj. testů, které mezi sebou porovnávají dva statistické soubory. Konstatovali jsme, že existují tři varianty testu a každý má určené předpoklady, při kterých jej lze použít. Nyní se budeme zabývat situací, kdy máme dva soubory, přičemž pozorování z obou souborů nelze spárovat. Soubory tedy mohou mít i ..

Read more

Levostranný párový t-test Uveďme si nyní typické zadání párového testu: Máme data o průměrném počtu vyrobených výrobků 20 pracovníky za jednu směnu. Vedení společnosti následně provedlo změnu výrobních procesů a pro stejných 20 pracovníků provedlo nová měření. Ověřte na hladině významnosti \(\alpha = 5 %\), že došlo ke zvýšení průměrné produkce pracovníků. Klíčové v zadání ..

Read more

V minulých článcích jsme se zabývali testy o střední hodnotě. Střední hodnota je nejznámějším ukazatelem polohy. Ukazatele polohy charakterizují určitou úroveň hodnot v souboru. Dále se ale můžeme zajímat o to, nakolik jsou hodnoty souboru vzájemně diverzifikované. Například průměrný počet bodů z testu ve škole popisuje průměrnou úroveň znalostí studentů, rozptyl známek nám pak říká, ..

Read more

Nejprve si odvodíme takzvaný výpočetní tvar pro rozptyl. Víme, že populační rozptyl se spočte pomocí vztahu \(\sigma^2_X = \mathrm{E} \left[ X – \mathrm{E} \left(X \right) \right]^2 \, .\) Pro výpočet hodnoty rozptylu pomocí kalkulačky je tento vzorec poměrně nepraktický, protože pro každou hodnotu souboru je potřeba zadat rozdíl mezi danou hodnotou a střední hodnotou. Můžeme ale ..

Read more

V minulých článcích jsme se zabývali testy o střední hodnotě. Střední hodnota je nejznámějším ukazatelem polohy. Ukazatele polohy charakterizují určitou úroveň hodnot v souboru. Dále se ale můžeme zajímat o to, nakolik jsou hodnoty souboru diverzifikované neboli vzájemně rozdílné. To určujeme pomocí ukazatelů variability. Například průměrný počet bodů z testu ve škole popisuje průměrnou úroveň ..

Read more

V předcházejících článcích jsme rozebírali z-test a t-test. Oba testy slouží k otestování hypotézy o střední hodnotě a liší se pouze předpokladem o znalosti rozptylu. Nabízí se ale otázka, k čemu vlastně máme dva testy? Jakou výhodu vlastně přináší znalost rozptylu? Na to se nyní podíváme. Pozn: Průběžně aktualizovaný přehled všech článků o statistických testech ..

Read more

Začněme s oboustranným t-testem. Uvažujeme následující příklad: Máme zařízení, které vyrábí součástku určité délky. Zařízení má určitou chybovost, jejíž přesnou velikost neznáme. Chyby mají normální rozdělení. Zařízení bylo nastaveno pracovníkem a my chceme ověřit, že pracovník nastavil správnou délku součástky, tj. 190 mm. Pro ověření jsme vybrali a přeměřili náhodný soubor dvaceti součástek. Obecné principy testování hypotéz, ..

Read more