Obyvateľstvo verzus štandardná odchýlka
V štatistikách sa používa niekoľko ukazovateľov na opis súboru údajov zodpovedajúcich jeho centrálnej tendencii, rozptylu a skewness. Štandardná odchýlka je jedným z najbežnejších meradiel rozptylu údajov od stredu súboru údajov.
Z dôvodu praktických ťažkostí nebude možné pri testovaní hypotézy použiť údaje z celej populácie. Preto používame hodnoty údajov zo vzoriek, aby sme urobili závery o populácii. V takejto situácii sa nazývajú odhadcovia, pretože odhadujú hodnoty parametrov populácie.
Je mimoriadne dôležité vyvodzovať z toho nezaujaté odhady. Odhadca sa považuje za nestranný, ak sa očakávaná hodnota tohto odhadcu rovná parametru populácie. Napríklad vzorový priemer používame ako nestranný odhad pre priemerný počet obyvateľov. (Matematicky je možné preukázať, že očakávaná hodnota priemeru vzorky sa rovná priemeru populácie). V prípade odhadu štandardnej odchýlky populácie je štandardná odchýlka vzorky tiež nestranným odhadcom.
Aká je štandardná odchýlka populácie?
Ak je možné zohľadniť údaje z celej populácie (napríklad v prípade sčítania), je možné vypočítať smerodajnú odchýlku populácie. Na výpočet smerodajnej odchýlky populácie sa najprv spočítajú odchýlky hodnôt údajov od priemeru populácie. Koreňový stredný štvorec (kvadratický priemer) odchýlok sa nazýva štandardná odchýlka populácie.
V triede 10 študentov sa údaje o žiakoch dajú ľahko zbierať. Ak sa na tejto populácii študentov testuje hypotéza, nie je potrebné používať hodnoty vzoriek. Napríklad sa meria hmotnosť 10 študentov (v kilogramoch) na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom je priemerná hmotnosť desiatich ľudí (v kilogramoch) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, čo je 71 (v kilogramoch). Toto je priemerný počet obyvateľov.
Teraz na výpočet smerodajnej odchýlky populácie vypočítame odchýlky od priemeru. Príslušné odchýlky od priemeru sú (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 a (79 - 71) = 8. Súčet štvorcov odchýlky je ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Štandardná odchýlka populácie je √ (366/10) = 6,05 (v kilogramoch). 71 je presná priemerná hmotnosť študentov triedy a 6.05 je presná štandardná odchýlka hmotnosti od 71.
Čo je štandardná odchýlka vzorky?
Ak sa na odhad parametrov populácie použijú údaje zo vzorky (veľkosti n), vypočíta sa štandardná odchýlka vzorky. Najskôr sa vypočítajú odchýlky hodnôt údajov od priemeru vzorky. Keďže sa namiesto priemeru populácie (ktorý nie je známy) používa priemer vzorky, nie je vhodné použiť kvadratický priemer. S cieľom kompenzácie použitia priemeru vzorky sa súčet druhých mocnín odchýlok delí (n-1) namiesto n. Druhá štandardná odchýlka vzorky je druhou odmocninou. V matematických symboloch S = √ ∑ (xja-X)2 / (n-1), kde S je smerodajná odchýlka vzorky, ẍ je priemer vzorky a xjaToto sú údajové body.
Teraz predpokladajme, že v predchádzajúcom príklade je populácia študentmi celej školy. Potom bude trieda iba vzorka. Ak sa táto vzorka použije pri odhade, štandardná odchýlka vzorky bude √ (366/9) = 6,38 (v kilogramoch), pretože 366 sa vydelí 9 namiesto 10 (veľkosť vzorky). Skutočnosť, ktorú treba dodržať, nie je zaručená ako presná hodnota smerodajnej odchýlky populácie. Je to iba odhad.
Aký je rozdiel medzi štandardnou odchýlkou populácie a štandardnou odchýlkou vzorky? • Štandardná odchýlka populácie je presná hodnota parametra používaná na meranie rozptylu od stredu, zatiaľ čo štandardná odchýlka vzorky je pre ňu nestranným odhadcom.. • Štandardná odchýlka populácie sa počíta, keď sú známe všetky údaje týkajúce sa každého jednotlivca populácie. Inak sa vypočíta smerodajná odchýlka vzorky. • Štandardná odchýlka populácie je daná σ = √ ∑ (xi-µ)2/ n kde µ je stredná hodnota populácie a n je veľkosť populácie, ale štandardná odchýlka vzorky je daná S = √ ∑ (xi-ẍ)2 / (n-1), kde ẍ je priemer vzorky a n je veľkosť vzorky.
|