TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ
PREDNÁŠKA testovanie štatistických hypotéz testy hypotéz o strednej hodnote test zhody strednej hodnoty so známou konštantou test zhody dvoch stredných hodnôt – nezávislé výbery test zhody dvoch stredných hodnôt – závislé výbery testy hypotéz o rozptyle test zhody rozptylu so známou konštantou test zhody dvoch rozptylov testy hypotéz o podieli test zhody rozdelenia
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ vychádzame z toho, že parametre ZS nie sú známe môžeme však o nich vysloviť určité predpoklady tieto predpoklady môžeme overiť štatistickými metódami, ktoré nazývame štatistické hypotézy postup, ktorým overujeme platnosť štatistických hypotéz, nazývame testovanie štatistických hypotéz
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ každý test hypotézy je zameraný na overenie určitej základnej hypotézy, ktorá sa nazýva nulová hypotéza H0 oproti nej je postavená alternatívna hypotéza H1 cieľom testovania hypotéz je rozhodnutie o prijatí alebo zamietnutí základnej hypotézy ak zamietame základnú hypotézu, potom prijímame alternatívnu hypotézu
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ štatistická hypotéza môže vyjadrovať predpoklad o rovnosti parametra ZS s ľubovoľnou známou konštantou alebo parametrom iného základného súboru v tomto prípade hovoríme o H0 hypotéze H0: Q=Q0 H0: Q-Q0=0 také hypotézy, pri ktorých sa predpokladá nerovnosť parametra ZS, sa nazývajú H1 hypotézy
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ H1 hypotézy môžu byť v rôznych tvaroch: obojstranná H1: Q≠Q0 jednostranné: pravostranná H1: Q>Q0 ľavostranná H1: Q<Q0
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ parameter Q, o ktorom máme určitú hypotézu, nepoznáme odhadujeme ho pomocou výberovej charakteristiky un un je náhodná premenná, pričom predpokladáme, že poznáme jej rozdelenie
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ rozhodnutie o zamietnutí, resp. nezamietnutí H0 uskutočňujeme na základe náhodného výberu nemôžeme ho urobiť s absolútnou presnosťou existuje určité riziko odhadu za predpokladu, že platí H0, rovná sa parameter Q predpokladanej veličine Q0 keďže est Q=un, potom rozdiel D=un-Q0 je len náhodnou chybou spôsobenou náhodným výberom
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ ak však H0 neplatí, t.j. Q≠Q0, potom sa rozdiel môže skladať z náhodnej chyby a systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom ZS Q a jeho predpokladanou veľkosťou Q0 = un-Q0=(un-Q)+(Q-Q0) náhodná chyba systematická chyba - rozdiel
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ v praxi nemožno zistiť, či rozdiel obsahuje iba náhodnú chybu alebo aj systematickú ak je však malé, pripisujeme ho iba náhodnosti výberu ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá znalosť kritickej hodnoty, ktorá rozdiel rozdelí na dve časti : pri rozdieloch < ako kritická hodnota, H0 nezamietame pri rozdieloch ako kritická hodnota, H0 zamietame veľkosť v konkrétnych prípadoch kolíše, je náhodnou veličinou, preto sa snažíme transformovať , ktoré je funkciou un a parametra základného súboru Q na veličinu G, ktorá má známe teoretické rozdelenie (napr. normované normálne, resp. Studentovo či iné rozdelenie)
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ G = f(un,Q) G = f() pričom funkcia hustoty náhodnej premennej G je f(g) vychádzame z platnosti H0:Q = Q0 a vypočítame testovaciu charakteristiku g = f(un,Q0) rozhodnutie o výsledku testu: môžeme potom nájsť také kritické hodnoty g1 a g2 náhodnej veličiny G, pre ktoré platí: P(g1 G g2) =1- alebo P(g1 Gg2) =
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ f(g) 1-a a/2 a/2 g1 g2 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 obor prijatia H0 rozhodnutie o výsledku testu, zamietnutí, resp. nezamietnutí H0 závisí od voľby hladiny významnosti hladina významnosti rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H0
Testovanie štatistických hypotéz Závery testov je možné robiť dvomi spôsobmi: klasický (na základe kritickej hodnoty) moderný prostredníctvom p hodnoty (p value) P hodnota predstavuje pravdepodobnosť, že výberová charakteristika nadobudne aspoň takú hodnotu ako je skutočne zistená hodnota (hodnota testovacej charakteristiky) p hodnota = P(U>u) p hodnota = vypočítaná hladina významnosti prakticky: ak p hodnota < hladina významnosti (a), tak H0 zamietame ak p hodnota < 0,05 rozdiel je preukazný ak p hodnota < 0,01 rozdiel je vysokopreukazný
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ popri správnom rozhodnutí o výsledku testu: prijatí správnej hypotézy zamietnutí nesprávnej hypotézy môže dôjsť k nesprávnemu rozhodnutiu: zamietnutí správnej hypotézy – chyby I.druhu prijatí nesprávnej hypotézy – chyby II. druhu
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ Skutočnosť pravda nepravda H0: pravda H1: nepravda Naše rozhodnutie správne Chyba II. typu Chyba I. typu správne 1-a – pravdepodobnosť prijatia správnej hypotézy a – riziko zamietnutia správnej hypotézy ak sa znižuje a, znižuje sa vznik chyby I. druhu = rozšíri sa obor prijatia H0 znižovaním a však rastie riziko vzniku chyby II. druhu – označuje sa ako b potom 1-b udáva silu testu = pravdepodobnosť zamietnutia H0 v prípade, ak je skutočne nesprávna v praxi: a=0,05, resp. a=0,01
Testovanie štatistických hypotéz chyba I. a II. druhu - graficky H0 hypotéza H1 hypotéza
TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ všeobecný postup testovania: rovnosť rozdiely definovanie 1. Formulácia hypotéz nulová hypotéza H0 - obsahuje definíciu rovnosti alternatíva hypotéza - je opakom k nulovej hypotéze 2. Definovanie hladiny významnosti akú pravdepodobnosť sme ochotní akceptovať pre chybu I.typu väčšinou 0,05 alebo 0,01 zber údajov testovanie 3. Výberové skúmanie vytvorenie výberového súboru výpočet výberových charakteristík 4. Voľba testovacieho kritéria na základe typu testu jeho výpočet 5. Určenie kritických hodnôt záver testu 6. Rozhodnutie o výsledku testu prijatie, resp. zamietnutie H0 interpretácia
Testy hypotéz o strednej hodnote test zhody strednej hodnoty so známou konštantou poznáme s2 nepoznáme s2 a n>30 nepoznáme s2 a n30 test zhody dvoch stredných hodnôt nezávislé súbory: poznáme s21, s22 nepoznáme s21, s22 a n1,n2>30 nepoznáme s21, s22 a n1, resp. n230 závislé súbory
Test zhody strednej hodnoty so známou konštantou nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) predpokladajme, že stredná hodnota m sa rovná známej konštante m0 formulácia hypotéz: H0: m = m0 H1: m ≠ m0 odhadujeme, že est m =
Test zhody strednej hodnoty so známou konštantou predpokladáme, že poznáme s2 ZS (teoretický predpoklad) testovacia charakteristika u má N(0,1)
Test zhody strednej hodnoty so známou konštantou nepoznáme s2 ZS a rozsah VS >30 est s2 = s12 testovacia charakteristika u má N(0,1)
Test zhody strednej hodnoty so známou konštantou nepoznáme s2 ZS a rozsah VS 30 est s2 = s12 testovacia charakteristika t má t (n-1) rozdelenie (Studentove r.)
Test zhody strednej hodnoty so známou konštantou rozhodnutie o výsledku testu: 1-a a/2 u1-a/2 obor prijatia H0 kritický obor, obor zamietnutia H0 f(u) -u1-a/2 ak |uvyp, tvyp| < u1-/2, ta, (n-1) H0 nezamietame ak | uvyp, tvyp| u1-/2, ta, (n-1) H0 zamietame
TEST ZHODY DVOCH STREDNÝCH HODNÔT Test zhody dvoch stredných hodnôt – nezávislé výbery predpokladáme, že výberové súbory sú nezávislé: prvky jedného súboru nemôžu byť zároveň prvkami druhého súboru prvky sa v danom súbore neopakujú nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) nech štatistický znak X2 v druhom ZS má normálne rozdelenie N(2, 22)
TEST ZHODY DVOCH STREDNÝCH HODNÔT predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné formulácia hypotéz: H0: m1 = m2 ,resp. H0: m1 - m2 = 0 H1: m1 ≠ m2 ,resp. H1: m1 - m2 ≠ 0 odhadujeme, že: est m1 = est m2 =
TEST ZHODY DVOCH STREDNÝCH HODNÔT predpokladáme, že poznáme rozptyly ZS1 a ZS2 (teoretický predpoklad) potom aj testovacia charakteristika u má N(0,1)
TEST ZHODY DVOCH STREDNÝCH HODNÔT nepoznáme rozptyly ZS1 a ZS2 a rozsahy VS1 a VS2 >30 est s12 = s112, est s22 = s122 testovacia charakteristika (po úprave), inak rovnaká ako v prípade a) u má N(0,1)
TEST ZHODY DVOCH STREDNÝCH HODNÔT nepoznáme rozptyly ZS1 a ZS2 a rozsah VS1 30 alebo rozsah VS2 30 est s12 = s112, est s22 = s122 podmienka: rozptyly porovnávaných základných súborov sa rovnajú testovacia charakteristika t má t (s.v.) rozdelenie (Studentove r.) stupne voľnosti = n1+n2-2
TEST ZHODY DVOCH STREDNÝCH HODNÔT predpokladajme, že rozptyly základných súborov 12 , 22 nepoznáme, pričom aspoň jeden z výberových súborov má malý rozsah n1 30, alebo n2 30. Nemôžeme však predpokladať zhodu rozptylov(12 22 ) (Overuje sa F-testom). Môžeme použiť približný Behrens-Fischerov test zhody stredných hodnôt pri nehomogénnej variancii.
TEST ZHODY DVOCH STREDNÝCH HODNÔT Test zhody dvoch stredných hodnôt – závislé výbery = párový t-test predpokladáme, že výberové súbory sú závislé: skúmanie na tej istej štatistickej jednotke dva krát prvky sa v daných súboroch opakujú rozsahy výberových súborov sa musia rovnať
TEST ZHODY DVOCH STREDNÝCH HODNÔT test je založený na diferencii di=xi1-xi2 formulácia hypotéz: H0: m1 = m2 ,resp. H0: md = 0 H1: m1 ≠ m2 ,resp. H1: md ≠ 0 testovacia charakteristika t má t (n-1) rozdelenie (Studentove r.)
Testy hypotéz o rozptyle test zhody rozptylu so známou konštantou test zhody dvoch rozptylov
Test zhody rozptylu so známou konštantou nech štatistický znak X má v ZS približne normálne rozdelenie X....N (, 2) predpokladajme, že rozptyl s2 sa rovná známej konštante s02 formulácia hypotéz: H0: s2 = s02 H1: s2 ≠ s02 odhadujeme, že est s2 = s12
Test zhody rozptylu so známou konštantou testovacia charakteristika c2 má c2(n-1) rozdelenie (chí kvadrát r.) /2 1 - 21-/2 2/2 f(2) obor prijatia H0 OZ Záver testu: ak c2>c21-a/2 c2<c2a/2 H0 nezamietame ak c2c21-a/2 c2c2a/2 H0 zamietame
Test zhody dvoch rozptylov nech štatistický znak X1v prvom ZS má normálne rozdelenie N(1, 12) nech štatistický znak X2 v druhom ZS má normálne rozdelenie N(2, 22) predpokladajme, že odhadované rozptyly s12 a s22 sú zhodné formulácia hypotéz: H0: s12 = s12 H1: s12 > s12 (jednostranný test) odhadujeme, že: est s12 = s112 a est s22 = s122
Test zhody dvoch rozptylov testovacia charakteristika F má Fa,(n1-1),(n2-1) rozdelenie (Fischerove r.) 1 - Fa,(n1-1),(n2-1) f(F) obor prijatia H0 OZ Záver testu: ak F< Fa,(n1-1),(n2-1) H0 nezamietame ak F Fa,(n1-1),(n2-1) H0 zamietame
Testy hypotéz o podieli test zhody podielu so známou konštantou test zhody dvoch podielov
A. Testy zhody podielu so známou konštantou Predpokladáme, že alternatívny znak s binomickým rozdelením je možné aproximovať na normálne rozdelenia. Predpokladajme, že podiel π sa rovná známej konštante π0 Formulácia hypotéz: H0: π = π0 H1: π ≠ π0
Test zhody podielu so známou konštantou testovacia charakteristika u má N(0,1) rozdelenie Záver testu: ak |u | < u 1-/2→ H0 nezamietame ak | u| u 1-/2 →H0 zamietame
B. Testy zhody dvoch podielov Predpokladáme, že alternatívny znak s binomickým rozdelením je možné aproximovať na normálne rozdelenia. Formulácia hypotéz: H0: π1 = π2 H1: π1 ≠ π2
Test zhody dvoch podielov testovacia charakteristika u má N(0,1) rozdelenie Záver testu: ak |u | < u 1-/2→ H0 nezamietame ak | u| u 1-/2 →H0 zamietame
Test zhody rozdelenia Okrem parametrov ZS môžeme overovať aj zhodu rozdelenia s iným (teoretickým) rozdelením Označenie: G(x) empirické rozdelenie H(x) teoretické rozdelenie Formulácia hypotéz: H0: G(x) = H(x) H1: G(x) ≠ H(x)
Test zhody rozdelenia Testovacie kritérium: ni empirické absolútne početnosti npi teoretické absolútne početnosti, ktoré vypočítame ako súčin rozsahu výberového súboru (n) a pi – pravdepodobnosť výskytu i-tého intervalu (spojité rozdelenie) za predpokladu platnosti H0. podmienka testu: v každej triede npi>5 (pri nesplnení zlučujeme triedy) Platí: Testovacie kritérium má χ2 rozdelenie s ν =m-1-p-s stupňami voľnosti, (m-počet intervalov, p-počet parametrov teoretického rozdelenie, s- počet zlučovaných tried).
Test zhody rozdelenia pi určíme prostredníctvom distribučnej funkcie vychádzajúc z: P(X<x)=F(x) F(x) ….NORMDIST(X, µ, , 1) P(x1<X<x2)=F(x2)-F(x1) P(X>x)=1-F(x)
Test zhody rozdelenia χ2 χ2(, ν) → H0 zamietame Záver: χ2 χ2(, ν) → H0 zamietame χ2< χ2(, ν) → H0 nezamietame Príklad: Overiť na hladine významnosti 0,05, či rozdelenie platov pracovníkov je zhodné s normálnym rozdelením.
Test zhody rozdelenia - príklad Vypočítaná hodnota testovacej charakteristiky je menšia ako kritická (tabuľková) hodnota, preto H0 nezamietame, t.j. rozdelenie platov pracovníkov je možné považovať za zhodné s normálnym rozdelením.
Dobrovoľné zadanie (5 bodov): Uveďte rôzne príklady na každý typ testu: test zhody strednej hodnoty so známou konštantou test zhody dvoch stredných hodnôt – nezávislé výbery test zhody dvoch stredných hodnôt – závislé výbery test zhody rozptylu so známou konštantou test zhody dvoch rozptylov ODOVZDAŤ PODPÍSANÉ NA PAPIERI NA NASLEDUJÚCOM CVIČENÍ, (okrem mena uviesť aj odbor a krúžok)
ĎAKUJEM ZA POZORNOSŤ