NEPARAMETRINIAI METODAI Neparametrinių metodų sąlygos MVV ir Z testas Parametrinių ir neprametrinių metodų skirtumai
Neparametrinis Wolfowitz, 1942 m.
PARAMETRINIAI METODAI Intervaliniai, santykių kintamieji Normalumu pagrįstus kriterijus nebus galima naudoti ir tais atvejais, kai duomenys išmatuoti ranginėje ar balinėje skalėje. Atitinka teorinį skirstinį (normalųjį (z); t; F ir kt.). Išvados apie populiacijas parametrais, gautais iš reprezentatyvios atsitiktinės imties rezultatų (μ, regresijos koeficientai ir t.t.) Parametrinės statistinės procedūros (t; ANOVA, koreliacija, regresija).
Išvados PI Hipotezių tikrinimo: t; z; F ir kt.
Normalių skirstinių pavyzdžiai
T skirstinys
F skirstinys
Neparametriniai metodai / statistinės procedūros mažoms imtims, kai skirstinių nepavyksta sužinoti dėl mažo imties dydžio, didelėms imtims, kai skirstiniai asimetriški arba neaiškūs, egzotiški ir pan. kai yra išskirčių duomenys neskaitmeniniai (nominalūs, ordinalūs, Likerto skalė) skirtingos dispersijos linijinio ryšio (koreliacija, regresija) Nuo parametro/skirstinio nepriklausomi metodai Kai imtys yra labai mažos, tuomet dažnai neina patikrinti jų normalumo (pvz., χ2 metodu). Tačiau normalumu pagrįsti kriterijai neretai tokiais vis vien naudojami – bet tik tada, kai žinoma, kad toks požymis paprastai skirstosi normaliai. Tuo tarpu didelėms imtims (pvz., n>100), net jei jos nėra iš tikrųjų normalios, kartais naudojami normalumu pagrįsti metodai, nes daugelis skirstinių didelėms imtims gali būti aproksimuoti normaliuoju skirstiniu.
Χ2 testas Vienas iš populiariausių. Testų grupė (suderinamumo, homogeniškumo, nepriklausomumo, vienai gr., dviem gr.). Pagrįstas stebimų / faktinių (angl. observed) ir tikėtinų (angl. expected) dažnių palyginimu.
Χ2 skirstinys
Mano-Vitnio-Vilkoksono (MVV) rangų sumos kriterijus nepriklausomoms imtims Šis testas galingiausias, kai kintamųjų skirstiniai skiriasi tik postūmiu. Mažai jautrus išskirtims, kai jų nedaug (skirtingai nuo t testo) Netinka, kai imčių dispersijos labai skiriasi (jei normalios→t testas) Mažos imtys (kai n1≤30, ir n2≤30) – U statistika, didelės (>20) – aproksimuojama normaliuoju skirstiniu (z) Šis testas vadinamas gana įvairiai, kadangi jį pasiūlė amerikiečiai Henry B. Mann'as ir D.R. Whitney'is ir nepriklausomai – Franc'as Wilcoxon'as (1892-1965). Neretai jo pavadinime apjungiamos visos trys pavardės (kaip čia), nors egzistuoja ir kitokios kombinacijos. Pvz., Siegel ir Castellan vadina Wilcoxon-Mann-Whitney test, dar kitur – tai Mann-Whitney U test ir pan
MVV U testo skaičiavimas Dvi imtis sujungiame į vieną, išdėstydami jų narius didėjimo tvarka (bendra variacinė eilutė). Eilutės nariams priskiriame rangus. Vėl atskiriame pagal lyginamas grupes. Apskaičiuojame statistikas kiekvienoje grupėje: U1= U2= R1 ir R2 – rangų, priskirtų atitinkamai pirmosios ir antrosios imčių nariams, suma 4. Iš lentelių randame n1 ir n2 atitinkančias dvipusio kriterijaus reikšmes. Jei gauta U ne mažesnė už didesniąją lentelėje pateiktą kriterijaus reikšmę arba ne didesnė už mažesniąją reikšmę, tai nulinė hipotezė atmetama.
MVV skaičiavimo pavyzdys (1)
MVV skaičiavimo pavyzdys (2)
MVV kritinių reikšmių lentelė Pvz. http://www.saburchill.com/IBbiology/downloads/002.pdf Mažesnė U reikšmė turi būti mažesnė už lentelėje pateiktą kritinę reikšmę (suvedus abiejų grupių dydžius) arba tiesiog online skaičiuoklė: http://www.socscistatistics.com/tests/mannwhitney/
Z testo skaičiavimas
Z testo skaičiavimas
Normalaus skirstinio (Z) lentelė Pvz. p.2 http://onlinepubs.trb.org/onlinepubs/nchrp/cd-22/manual/v2appendixc.pdf P reikšmės radimo pvz.: dvipusiam z-testui, jei testo reikšmė gauta 2.00, =2*P(Z=2.00) , P=1-(Z=2.00) =2*(1-0.9772) =0.0456 arba tiesiog online skaičiuoklė: http://www.socscistatistics.com/pvalues/normaldistribution.aspx
Neparametriniai metodai: reziume Lyginimas 2 grupėse (Mann-Whitney nepriklausomoms gr., McNema‘ro, Wilcoxon test porinėms gr. ir t. t.) Lyginimas daugiau nei 2 grupėse (Kruskal Wallis nepriklausomoms gr., Friedman susijusioms gr.)
Skirtumai Parametriniai metodai Neparametriniai metodai Naudojamos originalios reikšmės Naudojami rangai (eilės nr.) Tikslesni, sudėtingesni Mažiau tikslūs, lengvesni Reikalingas atitikimas teoriniam (dažniausiai normaliam) skirstiniui. Nereikalingos normalaus skirstinio prielaidos. Tinkamesni didelėms imtims. Tinkamesni mažesnėms imtims, bet ne pernelyg mažoms (priklauso nuo testo). Turi didesnę statistinę galią Mažiau galingi (jautrūs) Dažniausiai skaitmeniniams Naudingi nesuskaičiuojamiems duomenims, ordinaliems Vertina vidurkius Vertina medianas, skirstinių skirtumus Netikslūs, jei yra daug išskirčių Naudingesni, esant daugiau išskirčių Apskaičiuoja PI ir tikrina hipotezes Labiau tikrina hipotezes (P reikšmė), dažnai stinga PI.
Fišerio tikslusis testas http://www.danielsoper.com/statcalc3/calc.aspx?id=29 http://www.physics.csbsju.edu/stats/exact_NROW_NCOLUMN_form.html + OpenEpi