Variancia vs. Covariance
Rozdiely a kovariancia sú dve miery používané v štatistike. Odchýlka je miera rozptylu údajov a kovarzia označuje stupeň zmeny dvoch náhodných premenných spolu. Variant je skôr intuitívny koncept, ale kovariancia je definovaná matematicky v nie tak intuitívnom spočiatku.
Viac o variante
Odchýlka je miera rozptylu údajov od strednej hodnoty distribúcie. Hovorí, ako ďaleko ležia dátové body od priemeru distribúcie. Je to jeden z primárnych deskriptorov rozdelenia pravdepodobnosti a jeden z momentov rozdelenia. Rozptyl je tiež parametrom populácie a rozptyl vzorky od populácie slúži ako odhad pre rozptyl populácie. Z jedného hľadiska je definovaný ako štvorec štandardnej odchýlky.
V jednoduchom jazyku to možno opísať ako priemer štvorcov vzdialenosti medzi každým dátovým bodom a priemerom distribúcie. Na výpočet odchýlky sa používa nasledujúci vzorec.
Var (X) = E [(X-μ)2 ] pre populáciu a
Var (X) = E [(X- ~ x)2 ] pre vzorku
Ďalej sa môže zjednodušiť, aby sa získal Var (X) = E [X2 ] - (E [X])2.
Variácia má niektoré vlastnosti podpisu a často sa používa v štatistikách na zjednodušenie používania. Odchýlka nie je negatívna, pretože je to štvorec vzdialeností. Rozsah rozptylu však nie je obmedzený a závisí od konkrétneho rozdelenia. Rozptyl konštantnej náhodnej premennej je nula a rozptyl sa nemení s ohľadom na parameter polohy.
Viac o Covariance
V štatistickej teórii je kovariancia mierou toho, ako sa spolu menia dve náhodné premenné. Inými slovami, kovariancia je miera sily korelácie medzi dvoma náhodnými premennými. Môže sa tiež považovať za zovšeobecnenie pojmu rozptyl dvoch náhodných premenných.
Spoločenstvo dvoch náhodných premenných X a Y, ktoré sú spoločne distribuované s konečnou druhou hybnosťou, sa nazýva σXY= E [(X-E [X]) (Y-E [Y])]. Z tohto dôvodu možno rozptyl vnímať ako osobitný prípad kovariancie, kde sú dve premenné rovnaké. Cov (X, X) = Var (X)
Normalizáciou kovariancie možno získať lineárny korelačný koeficient alebo Pearsonov korelačný koeficient, ktorý je definovaný ako ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graficky možno kovarianciu medzi párom dátových bodov vidieť ako oblasť obdĺžnika s dátovými bodmi v opačných vrcholoch. Môže sa interpretovať ako miera separácie medzi dvoma dátovými bodmi. Ak vezmeme do úvahy obdĺžniky pre celú populáciu, prekrývanie obdĺžnikov zodpovedajúcich všetkým údajovým bodom sa môže považovať za silu oddelenia; rozptyl týchto dvoch premenných. Covariance je v dvoch dimenziách kvôli dvom premenným, ale jeho zjednodušenie na jednu premennú dáva rozptyl jednej, pretože oddelenie v jednej dimenzii.
Aký je rozdiel medzi Variance a Covariance?
• Variancia je miera rozšírenia / rozptylu v populácii, zatiaľ čo kovarzia sa považuje za mieru variácie dvoch náhodných premenných alebo sily korelácie..
• Odchýlka sa môže považovať za osobitný prípad kovariancie.
• Odchýlka a kovariancia závisia od veľkosti dátových hodnôt a nemožno ich porovnávať; preto sú normalizované. Covariance je normalizovaný na korelačný koeficient (delený súčinom štandardných odchýlok dvoch náhodných premenných) a rozptyl je normalizovaný na štandardnú odchýlku (pomocou druhej odmocniny)