Štatistika Mgr. Jozef Vozár 2007
Základné pojmy Štatistický súbor je daná, konečná, neprázdna množina M. Rozsah súboru n je počet prvkov množiny M Kvantitatívny znak súboru je ľubovoľná funkcia x: M R. Táto funkcia má hodnoty x1 , ... xn .
Charakteristiky Priemery: Aritmetický priemer hodnôt znaku x1 , ... xn
Geometrický priemer hodnôt x1 , ... xn
Modus je najčastejšie sa vyskytujúca hodnota spomedzi hodnôt znaku. Mod(x)
Medián je prostredná hodnota medzi hodnotami znaku, ak sú usporiadané podľa veľkosti Med(x)
Smerodajná odchýlka x1 , ... xn
Disperzia – rozptyl
Štatistická závislosť znakov Nech x1 , ... xn sú hodnoty znaku x a y1 , ... yn sú hodnoty znaku y. Koeficient korelácie r týchto znakov definujeme
Kde v menovateli sú smerodajné odchýlky znakov x,y, a
Príklad Výška Hmotnosť 162 60 164 65 165 68 166 66 169 170 70 175 177 179 priemer 1697 676 169,7 67,6
Príklad Výška Hmotnosť Δx Δy Δx.Δx Δy.Δy Δx.Δy 162 60 -7,7 -7,6 59,29 57,76 58,52 164 65 -5,7 -2,6 32,49 6,76 14,82 165 68 -4,7 0,4 22,09 0,16 -1,88 166 66 -3,7 -1,6 13,69 2,56 5,92 169 -0,7 0,49 -0,28 170 0,3 0,09 -0,48 70 2,4 5,76 0,72 175 5,3 28,09 2,12 177 75 7,3 7,4 53,29 54,76 54,02 179 9,3 86,49 22,32 priemer 1697 676 296,1 136,4 155,8 169,7 67,6
Príklad s1 = 5,55 s2 = 3,69 k =15,88 r = 0,755
Iný spôsob zadania úlohy, Príklad 2 Iný spôsob zadania úlohy, pomocou tabuľky
4 6 8 10 -1 1 2 3 5 X Y
Výpočet priemerov a rozptylov Priemer x = 1/19(3.4+5.6+4.8+7.10)= 7,579 Priemer y = 1/19(1.-1+9.1+7.3+2.5) = 2,053 s1 = 2,208 s2 = 1,503
Výpočet k, r k = 1/19(4-7,59).(-1-2,053) + 2.(4-7,579)(1-2,053) + 4(6-7,579)(1-2,053) + 3.(8-7,579)(1-2,053)+(6-7,579)(3-2,053)+(8-4,579)(3-2,053)+5(10-7,579)(3-2,053)+2(10-7,579)(5-2,053) = 2,548 r = 0,767
Hodnotenie r Ak r je blízke k 1 resp. k -1 potom medzi x a y existuje veľká korelácia = veľmi spolu súvisia. V prípade 1 priama, a v prípade -1 nepriama. Ak je r blízke 0 potom možno s istou opatrnosťou povedať, že x a y sú nezávislé, alebo len málo závislé.