Zhromažďovanie a výpočet štatistických údajov na získanie priemeru je často zdĺhavý a únavný proces. T-test a jednosmerná analýza rozptylu (ANOVA) sú dva najbežnejšie testy používané na tento účel.
T-test je štatistický test hypotéz, pri ktorom je štatistika testu nasledovaná Studentovým t distribúciou, ak je podporovaná nulová hypotéza. Tento test sa uplatňuje, keď štatistika testu nasleduje normálne rozdelenie a ak je známa hodnota mierky v štatistike testu. Ak termín škálovania nie je známy, nahradí sa odhadom na základe dostupných údajov. Štatistika testu bude sledovať Studentovu distribúciu t.
William Sealy Gosset uviedol t-štatistiku v roku 1908. Gosset bol chemik pre pivovar Guinness v Dubline v Írsku. Guinnessský pivovar mal politiku náboru najlepších absolventov škôl z Oxfordu a Cambridge a vyberal z tých, ktorí by mohli poskytovať aplikácie biochémie a štatistiky pre zavedené priemyselné procesy spoločnosti. William Sealy Gosset bol jedným z takýchto absolventov. William Sealy Gosset navrhol t-test, ktorý bol pôvodne navrhnutý ako spôsob, ako nákladovo efektívnym spôsobom monitorovať kvalitu piva (tmavé pivo, ktoré pivovar vyrába). Gosset uverejnil test pod názvom „Student“ v Biometrika, približne v roku 1908. Dôvodom pre názov pera bolo trvanie Guinnessovej zmluvy, pretože spoločnosť chcela zachovať svoju politiku využívania štatistík ako súčasť svojich „obchodných tajomstiev“..
Štatistika T-testu sa spravidla riadi tvarom T = Z / s, kde Z a s sú funkciami údajov. Premenná Z je navrhnutá tak, aby bola citlivá na alternatívnu hypotézu; v skutočnosti je veľkosť premennej Z väčšia, ak je alternatívna hypotéza pravdivá. Medzitým je 's' parameter mierky, ktorý umožňuje určiť distribúciu T. Predpoklady, na ktorých sa zakladá t-test, sú: a) Z sa riadi štandardným normálnym rozdelením pod nulovou hypotézou; b) ps2 sleduje rozdelenie Ï ‡ 2 s stupňami voľnosti podľa nulovej hypotézy (kde p je kladná konštanta); a c) hodnota Z a hodnota S sú nezávislé. V špecifickom type t-testu sú tieto podmienky dôsledkom skúmanej populácie, ako aj spôsobom, akým sa údaje odoberajú..
Na druhej strane analýza rozptylu (ANOVA) je súbor štatistických modelov. Zatiaľ čo vedci a štatistici používajú princípy ANOVA už dlhý čas, až do roku 1918 Sir Ronald Fisher navrhol formalizovať analýzu rozptylu v článku s názvom „Korelácia medzi príbuznými o predpokladoch Mendelovho dedičstva“. , Od tej doby sa ANOVA rozšírila vo svojom rozsahu a uplatňovaní. ANOVA je vlastne nesprávne pomenovanie, pretože nie je odvodené z rozdielov rozptylov, ale skôr z rozdielov medzi prostriedkami skupín. Zahŕňa pridružené postupy, pri ktorých je pozorovaná odchýlka v konkrétnej premennej rozdelená na komponenty, ktoré možno pripísať rôznym zdrojom variácie.
ANOVA v podstate poskytuje štatistický test na zistenie, či sú prostriedky niekoľkých skupín všetky rovnaké, a preto zovšeobecňuje t-test na viac ako dve skupiny. ANOVA môže byť užitočnejšia ako dvojvzorkový t-test, pretože má menšiu šancu na chybu typu I. Napríklad mať viacnásobné dvojstranné t-testy by mali väčšiu šancu spáchať chybu ako ANOVA rovnakých premenných na získanie priemeru. Model je rovnaký a štatistika testu je pomer F. Zjednodušene povedané, t-testy sú iba špeciálnym prípadom ANOVA: vykonanie ANOVA bude mať rovnaký výsledok z viacerých t-testov. Existujú tri triedy modelov ANOVA: a) Modely s pevnými účinkami, ktoré predpokladajú, že údaje pochádzajú z bežných populácií, líšia sa iba svojimi prostriedkami; b) Modely náhodných efektov, ktoré predpokladajú, že údaje opisujú hierarchiu rôznych populácií, ktorých rozdiely sú obmedzené hierarchiou; a c) modely so zmiešaným účinkom, čo sú situácie, keď sú prítomné pevné aj náhodné účinky.