prof.Ing. Zlata Sojková,CSc. ANALÝZA ROZPTYLU prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Analýza rozptylu V praxi často je potrebné porovnávať väčší počet nezávislých náhodných výberov z hľadiska úrovne, t. zn. zaujíma nás hypotéza: pre aspoň jeno i (i = 1, 2,…m) pre m > 2, kde i , i =1, 2, …m sú stredné hodnoty z normálne rozdelených základných súborov s rovnakým rozptylom 2 , t.j. N(, 2) K overeniu tejto hypotézy sa používa dôležitá štatistická metóda, nazývaná Analýza rozptylu, skrátene ANOVA (resp. AR) prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. V praxi sa AR používa vtedy, ak skúmame vplyv jedného resp. viacerých faktorov (ošetrení) na skúmaný štatistický znak Faktory budeme označovať A, B,…a v AR ich budeme zohľadňovať len ako kvalitatívne znaky s rôznymi obmenami - úrovňami faktora výsledný štatistický znak bude kvantitatívny a označíme ho Y najčastejšie sa AR používa pri vyhodnocovaní biologických experimentov Všimneme si najjednoduchší prípad AR s jedným faktorom, ktorú nazývame jednofaktorová AR prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Úrovňou faktora budeme označovať: určité množstvo kvantitatívneho faktora, napr. množstvo dávok čistých živín pri hnojení, rôzne príjmové skupiny domácností, určitý druh kvalitatívneho faktora, napr. rôzne odrody tej istej plodiny, spôsoby umiestnenia výrobkov v predajni, AR je zovšeobecnením Studentovho t-testu pre nezávislé výbery AR zároveň skúma vplyv kvalitatívneho faktora (faktorov) na výsledný kvantitatívny znak - teda analyzuje vzťahy medzi znakmi prof.Ing. Zlata Sojková,CSc.
Schéma jednofaktorového experimentu “vyvážený pokus” riadkový súčet riadkový priemer opakovania A 1 2… j… n Yi . yi . 1 y11 y12 y1j y1n Y1. y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. m ym1 ym2 ymj ymn Ym. ym. Y.. y.. Úrovne faktora Celkový súčet celkový priemer prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. riadkový súčet: celkový súčet: riadkový priemer: celkový priemer: prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Model pre výslednú napozorovanú hodnotu: kde i = 1, 2,…, m j = 1,2,…, n Kde - očakávaná hodnota pre všetky úrovne faktora a napozorované hodnoty, i - efekt i-tej úrovne faktora A eij - náhodná chyba, ktorým je každé meranie zaťažené, resp. výsledok vplyv náhodných činiteľov prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. alebo Nulovú hypotézu potom môžme formulovať aj nasledovne: Ho : 1 = 2 =… i = m = 0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H1: i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Odhadmi jednotlivých parametrov sú nasledovné výberové charakteristiky: čo môžme prepísať: prof.Ing. Zlata Sojková,CSc.
Porovnanie dvoch experimentov s tromi úrovňami faktora 3 1 2 1 2 3 prof.Ing. Zlata Sojková,CSc.
Princíp Analýzy rozptylu Podstata analýzy rozptylu spočíva v rozklade celkovej variability výsledného skúmaného znaku Sr Sc S1 Variabilita medzi úrovňamifaktora, spôsobená pôsobením faktora A, “variabilita medzi triedami, riadkami” Variabilita náhodná, reziduálna, “vo vnútri tried Celková variabilita prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. ANOVA Variabilita 3 Priemerný štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami m-1 s12 S1 Reziduálna variabilta m.n - m sr2 Sr Celková variabilita N-1= m .n-1 Sc prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Testovacie kritérium možno pre jednofoktorovú AR - vyvážený pokus zapísať podrobne vzťahom: Hodnotu F testovacieho kritéria porovonáme s príslušnou tabuľkovou hodnotou F-rozdelenia: F , pre stupne voľnosti (m-1) a (m.n - m) prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Rozhodnutie o výsledku testu: Ak F vyp F. ((m-1,(N-m)) Ho zamietame, v takom prípade je aspoň efekt jednej úrovne faktora preukazný, teda priemerna úroveň ukazovateľa sa štatisticky významne líši od ostatných. Resp. aspoň jeden efekt i je štatisticky významne odlišný od nuly. Ak F vyp F Ho nezamietame F Obor nezamietnutia Ho kritický obor, obor zatnutia H0 prof.Ing. Zlata Sojková,CSc.
Ak nulovú hypotézu zamietame: Zistili sme len, že je preukazný vplyv faktora na skúmaný znak, ďalej je potrebné skúmať medzi ktorými úrovňami faktora je a medzi ktorými nie je preukazný rozdiel - k tomúto účelu sa používajú testy kontrastov Medzi testy kontrastov patria: Duncanov test, Scheffeho test, Tuckey test a iné….. prof.Ing. Zlata Sojková,CSc.
Podmienky použitia AR: Výbery pochádzajú z normálnych rozdelení, narušenie tohto predpokladu nemá podstatnejší vplyv na výsledky AR štatistická nezávislosť náhodných chýb eij zhodné reziduálne rozptyly 12 = 22 = …. = 2 , t.j. D(eij) = 2 pre všetky i = 1,2…., m, j=1,2, …n tento predpoklad je závažnejší a možno ho overovať Cochranovým, resp. Bartlettovým testom prof.Ing. Zlata Sojková,CSc.
Schéma jednofaktorového experimentu “nevyvážený pokus” riadkový súčet riadkový priemer Rôzny počet opakovaní A 1 2… j … ni Yi . yi . 1 y11 y12 y1j ... n1 Y1. y1. 2 y21 y22 y2j ... n2 Y2. y2. … ……….. i yi1 yi2 yij ... ni Yi. yi. m ym1 ym2 ymj ... nm Ym. ym. Y.. y.. Úrovne faktora Kde celkový priemer prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. 3 Priemerný štvorec (1/2) 4 F-krité rium ANOVA Variabilita 1 Súčet štvorcov odchýlok 2 Stupne voľnosti Variabilita medzi triedami m-1 s12 S1 Reziduálna variabilta N - m sr2 Sr Celková variabilita N-1 S prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc.
Dvojfaktorová analýza rozptylu bez opakovania Uvažujme vplyv faktora A, ktorý skúmame na m - úrovniach, i = 1,2,….,m ďalej uvažujme faktor B, ktorý sledujeme na n - úrovniach , j = 1,2, …, n na každej i-tej úrovni faktora A a j-tej úrovni faktora B máme len jedno pozorovanie (opakovanie) yij overujeme tak vplyv dvoch nulových hypotéz prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Schéma dvojfaktorového experimentu s jedným pozorovaním v každej podtriede DAR riadkové súčty n-úrovní faktora B B A 1 2 … j … n Yi . yi . 1 y11 y12 y1j y1n Y1. Y1. 2 y21 y22 y2j y2n Y2. y2. … ……….. i yi1 yi2 yij yin Yi. yi. m ym1 ym2 ymj ymn Ym. ym. Y.1 Y.2 ... Y.j ... Y.1 Y.. y.1 y.2 ... y.j ... y.1 y.. m-úrovní faktora A Riadkové priemery celkový priemer Stĺpcové súčty stĺpcové priemery prof.Ing. Zlata Sojková,CSc.
Overujeme platnosť dvoch nulových hypotéz Model pre skúmaný znak môžme zapísať Hypotéza pre faktor A: Ho 1: 1 = 2 =… i = m = 0 t.j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H11 : i 0 pre aspoň jedno i (i = 1,2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly Overujeme platnosť dvoch nulových hypotéz prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Hypotéza pre faktor B: Ho 2: 1 = 2 =… j = n = 0 t.j. že efekty všetkých úrovni faktora B sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H12 : j 0 pre aspoň jedno j (j = 1,2…m) efekt j aspoň jednej j - úrovne faktora B je preukazný, významne odlišný od nuly prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. 3 Priem. štvorec (1/2) 4 F-krité rium 1 Súčet štvorcov odchýlok 2 Stupne voľnosti DAR Variabilita Variabilita medzi riadkami S1 m-1 s12 Variabilita medzi stĺpcami S2 n-1 s22 Reziduálna variabilta Sr sr2 (m-1)(n-1) Celková variabilita Sc m.n -1 prof.Ing. Zlata Sojková,CSc.
Rozklad celkovej variability skúmaného znaku: Sc= S1 + S2 + S r Variabilita medzi riadkami, vplyv faktora A Variabilita medzi stĺpcami, vplyv faktora B Reziduálna variabilita Celková variabilita prof.Ing. Zlata Sojková,CSc.
Dvojfaktorová analýza rozptylu s opakovaním Uvažujme vplyv dvoch faktorov: faktora A, ktorý skúmame na m - úrovniach, i = 1,2,….,m a faktora B, ktorý sledujeme na n - úrovniach , j = 1,2, …, n Skúmame nielen individuálny vplyv daných faktorov, ale aj ich vzájomné pôsobenie (interakciu) Pre každú kombináciu úrovní máme viac pozorovaní (opakovaní) yij Overujeme tak vplyv troch nulových hypotéz prof.Ing. Zlata Sojková,CSc.
Schéma dvojfaktorového experimentu s interkaciou prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Testy kontrastov v prípade, že H0 zamietame, zaujíma nás, medzi ktorými strednými hodnotami existujú štatisticky významné rozdiely existuje široká škála testov zameraná na viacnásobné porovnanie výberových priemerov je možné vytvoriť m*(m-1)/2 kontrastov prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Testy kontrastov Fischerov LSD test Duncanov test Student-Newman-Keulsov test Tukeyho test Scheffeho test prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Fischerov LSD test LSD = Least Significant Difference je založený na t-teste štatisticky významný rozdiel je potvrdený, ak platí vzťah: kde: kritická hodnota t rozdelenia pri m(n-1) stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Duncanov test štatisticky významný rozdiel je potvrdený, ak platí vzťah: kde: tabuľovaná hodnota Duncanovho testu pre daný počet rozdielov a pri reziduálnom stupni voľnosti prof.Ing. Zlata Sojková,CSc.
Student-Newman-Keulsov test štatisticky významný rozdiel je potvrdený, ak platí vzťah: kde: tabuľovaná hodnota Student-Neumannovho - Keulsovho testu pre daný počet porovnávaných rozdielov a pri reziduálnom stupni voľnosti prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Tukeyho test štatisticky významný rozdiel je potvrdený, ak platí vzťah: kde: tabuľovaná hodnota Tukeyho testu. prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Scheffeho test štatisticky významný rozdiel je potvrdený, ak platí vzťah: kde: kritická hodnota F rozdelenia pri (m-1) a m(n-1) stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Ktorý test použiť? Test Sila testu (1-β) Chyba I. druhu (α) LSD najvyššia Duncan Student-Newman-Keuls Tukey Scheffe najnižšia viac konzervatívny,, menej pravdepodobné, že bude objavený skutočný rozdiel viac pravdepo-dobné,, že bude určený nesprávny rozdiel prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Ktorý test použiť? závisí, ktorý typ chyby je akceptovateľnejší z hľadiska analýzy daného problému, t.j. neurčenie rozdielu, ak skutočne existuje, resp. určenie rozdielu, ktorý neexistuje. prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc.
Testy kontrastov - Statgraphics Multiple Range Tests Method: 95,0 percent LSD Count Mean Homogeneous Groups Col_4 5 303,8 X Col_3 5 337,0 XX Col_1 5 344,2 X Col_2 5 349,8 X Contrast Sig. Difference +/- Limits Col_1 - Col_2 -5,6 38,7085 Col_1 - Col_3 7,2 38,7085 Col_1 - Col_4 * 40,4 38,7085 Col_2 - Col_3 12,8 38,7085 Col_2 - Col_4 * 46,0 38,7085 Col_3 - Col_4 33,2 38,7085 * denotes a statistically significant difference. prof.Ing. Zlata Sojková,CSc.
Testy kontrastov - Statgraphics prof.Ing. Zlata Sojková,CSc.
Overenie zhody variability predpokladáme, že skúmané výberové súbory majú približne normálne rozdelenie a rozdiely rozptylov medzi testovanými skupinami sú nepreukazné. H0: Testy: Cochranov test Hartleyov test Bartlettov test prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Cochranov test je ho vhodné použiť, ak u skúmaných výberových súborov sú značné rozdiely medzi rozptylmi testovacia charakteristika: ak G ≥ Gα, m, n-1 → H0 zamietame Gα, m, n-1 - tabuľková hodnota pri m a n-1 stupňoch voľnosti prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc. Bartlettov test spočíva v porovnávaní aritmetického a geometrického priemeru rozptylov. Ak sú rozptyly rovnaké, potom aj priemery sú rovnaké. testovacia charakteristika: ki = ni-1 m – počet výberových súborov ni – rozsah i-teho výberového súboru Ak χ2χ2(m-1), potom H0 zamietame prof.Ing. Zlata Sojková,CSc.
prof.Ing. Zlata Sojková,CSc.