NEPARAMETRINIAI METODAI Neparametrinių metodų sąlygos MVV ir Z testas Parametrinių ir neprametrinių metodų skirtumai
PARAMETRINIAI METODAI Atitinka teorinį skirstinį (normalųjį (z); t; F ir kt.). Išvados apie populiacijas parametrais, gautais iš reprezentatyvios atsitiktinės imties rezultatų (μ, p0, regresijos koeficientai ir t.t.) Parametrinės statistinės procedūros (t; ANOVA, koreliacija, regresija).
Išvados PI Hipotezių tikrinimo: t; z; F ir kt.
Normalių skirstinių pavyzdžiai
T skirstinys
F skirstinys
Testai hipotezių tikrinimui Reikalingas normalus skirstinys: t z; F ir kt.
Neparametriniai metodai / statistinės procedūros Jei neatitinka teorinio skirstinio, dispersijų vienodumo, linijinio ryšio (koreliacija, regresija), galima mėginti adaptuoti parametrinius metodus, bet dažnai neparametriniai gali būti geriau. Vis dėlto parametrinių metodų galimybes tyrimų praktikoje riboja dvi priežastys. 1. Retai kada pavyksta sukonstruoti algebriniu požiūriu nepriekaištingą kiekybinę skalę (santykių arba intervalinę), išskyrus galbūt tik tuos atvejus, kai matuojama standartizuotais testais arba kai matuojami bandomųjų antropometriniai ir fiziniai duomenys. 2. Ne visi empiriniai dėsningumai atitinka normalaus skirstinio teorinį modelį. Tuo tarpu nepriekaištinga kiekybinė skalė ir pagrįsta empirinio skirstinio aproksimacija į normalų teorinį skirstinį yra pagrindinės korektiško parametrinių metodų naudojimo sąlygos. Butent todėl socialinių tyrimų praktikoje reikšmingi neparametriniai statistiniai kriterijai, kurie leidžia operuoti įvairių skalių (intervalinės, ranginės, nominalinės) duomenimis ir neatsižvelgti į empirinio skirstinio tipą. Pažymėtina, kad statistiniai sprendimai, atliekami tiek parametrinių, tiek neparametrinių kriterijų pagrindu, turi prasmę tik atsitiktinių imčių atveju.
Neparametriniai metodai / statistinės procedūros mažoms imtims, kai skirstinių nepavyksta sužinoti dėl mažo imties dydžio, didelėms imtims, kai skirstiniai asimetriški arba neaiškūs, egzotiški ir pan. kai yra išskirčių duomenys neskaitmeniniai (nominalūs, ordinalūs, Likerto skalė) Nuo parametro/skirstinio nepriklausomi metodai Kai imtys yra labai mažos, tuomet dažnai neina patikrinti jų normalumo (pvz., χ2 metodu). Tačiau normalumu pagrįsti kriterijai neretai tokiais vis vien naudojami – bet tik tada, kai žinoma, kad toks požymis paprastai skirstosi normaliai. Tuo tarpu didelėms imtims (pvz., n>100), net jei jos nėra iš tikrųjų normalios, kartais naudojami normalumu pagrįsti metodai, nes daugelis skirstinių didelėms imtims gali būti aproksimuoti normaliuoju skirstiniu.
Χ2 testas Vienas iš populiariausių. Testų grupė (suderinamumo, homogeniškumo, nepriklausomumo, vienai gr., dviem gr.). Pagrįstas stebimų / faktinių (angl. observed) ir tikėtinų (angl. expected) dažnių palyginimu.
Χ2 skirstinys
Mano-Vitnio-Vilkoksono (MVV) rangų sumos kriterijus nepriklausomoms imtims Šis testas galingiausias, kai kintamųjų skirstiniai skiriasi tik postūmiu. Mažai jautrus išskirtims, kai jų nedaug (skirtingai nuo t testo) Mažos imtys – U statistika, didelės (>20) – aproksimuojama normaliuoju skirstiniu (z) Šis testas vadinamas gana įvairiai, kadangi jį pasiūlė amerikiečiai Henry B. Mann'as ir D.R. Whitney'is ir nepriklausomai – Franc'as Wilcoxon'as (1892-1965). Neretai jo pavadinime apjungiamos visos trys pavardės (kaip čia), nors egzistuoja ir kitokios kombinacijos. Pvz., Siegel ir Castellan vadina Wilcoxon-Mann-Whitney test, dar kitur – tai Mann-Whitney U test ir pan
MVV U testo skaičiavimas Dvi imtis sujungiame į vieną, išdėstydami jų narius didėjimo tvarka (bendra variacinė eilutė). Eilutės nariams priskiriame rangus. Vėl atskiriame pagal lyginamas grupes. Apskaičiuojame statistikas kiekvienoje grupėje: U1= U2= R1 ir R2 – rangų, priskirtų atitinkamai pirmosios ir antrosios imčių nariams, suma 4. Iš lentelių randame n1 ir n2 atitinkančias dvipusio kriterijaus reikšmes. Jei gauta U ne mažesnis už didesniąją lentelėje pateiktą kriterijaus reikšmę arba ne didesnė už mažesniąją reikšmę, tai nulinė hipotezė atmetama.
MVV skaičiavimo pavyzdys (1)
MVV skaičiavimo pavyzdys (2)
MVV kritinių reikšmių lentelė Pvz. p.15 http://www.saburchill.com/IBbiology/downloads/002.pdf Mažesnė U reikšmė turi būti mažesnė už lentelėje pateiktą kritinę reikšmę (suvedus abiejų grupių dydžius) arba tiesiog online skaičiuoklė: http://www.socscistatistics.com/tests/mannwhitney/
Z testo skaičiavimas
Z testo skaičiavimas
Normalaus skirstinio (Z) lentelė Pvz. p.2 http://onlinepubs.trb.org/onlinepubs/nchrp/cd-22/manual/v2appendixc.pdf P reikšmės radimo pvz.: dvipusiam z-testui, jei testo reikšmė gauta 2.00, =2*P(Z=2.00) , P=1-(Z=2.00) =2*(1-0.9772) =0.0456 arba tiesiog online skaičiuoklė: http://www.socscistatistics.com/pvalues/normaldistribution.aspx
Kiti neparametriniai metodai Lyginimas 2 grupėse (Mann-Whitney nepriklausomoms gr., McNema‘ro, Wilcoxon test porinėms gr. ir t. t.) Lyginimas daugiau nei 2 grupėse (Kruskal Wallis nepriklausomoms gr., Friedman susijusioms gr.)
Skirtumai Parametriniai metodai Neparametriniai metodai Naudojamos originalios reikšmės Naudojami rangai (eilės nr.) Tikslesni, sudėtingesni Mažiau tikslūs, lengvesni Reikalingas atitikimas teoriniam (dažniausiai normaliam) skirstiniui. Nereikalingos normalaus skirstinio prielaidos. Tinkamesni didelėms imtims. Tinkamesni mažesnėms imtims, bet ne pernelyg mažoms (priklauso nuo testo). Turi didesnę statistinę galią Mažiau galingi (jautrūs) Dažniausiai skaitmeniniams Naudingi nesuskaičiuojamiems duomenims, ordinaliems Vertina vidurkius Vertina medianas, skirstinių skirtumus Netikslūs, jei yra daug išskirčių Naudingesni, esant daugiau išskirčių Apskaičiuoja PI ir tikrina hipotezes Labiau tikrina hipotezes (P reikšmė), dažnai stinga PI.
Fišerio tikslusis testas http://www.danielsoper.com/statcalc3/calc.aspx?id=29 http://www.physics.csbsju.edu/stats/exact_NROW_NCOLUMN_form.html