Upptaka 6 Kafli 8 Stefán Hrafn Jónsson Aðferðafræði II 17-10-2013 Upptaka 6 Kafli 8 Stefán Hrafn Jónsson
Dagskráin í dag og næstu daga 16.10 Kafli 8 Stefán Hrafn 17.10 Kafli 8. Aníta 23.10 Upphaf kafla 9. Stefán Og tæknileg atriði við próftöku 24.10 Próf í kennslustofu í tíma í stofu HT 105. Þröngt verða sáttir að sitja
Kafli 8 í dag Um upptökur o.fl. Tilgátuprófun Dæmi bls 183 (mean, one sample) Fimm skref tilgátuprófunar Dæmi bls 205 (proportion, one sample) (ekki í upptöku) Lykilatriði að vita hvort við erum með eitt eða fleiri úrtök Dæmi á töflu og í Socrative Spurningar og svör (QA)
Á morgun Aníka T dreifingin Að velja alpha mörk Annað Type I error Type II error Annað
Höfundaréttur Þessar glærur og þessi upptaka er aðeins ætlaðar til notkunar í kennslu og námi í Félags og mannvísindadeild Háskóla Íslands í námskeiðinu: Allur réttur áskilinn, Stefán Hrafn Jónsson Notkun fyrir önnur námskeið eru háð skriflegu leyfi kennara
Gefið Meðaltal í þýði 140 kr Staðalfrávik í þýði 30 kr Úrtak N = 100 Einfalt tilviljunarúrtak Samkvæmt central limit theorem þá er meðaltal úrtakadreifingarinnar 140, sama og í þýði . Staðalfrávik úrtakadreifingar er 3 og er reiknað frá staðalfráviki þýðis deilt með kvaðratrót af úrtaksstærð eða 30/10 (kvaðrat rót af 100 er 10) 143 er eitt staðalfrávik (úrtakadreifingar) fyrir ofan meðaltal 137 er einu staðalfrávíki fyri neðan meðaltal. Eitt staðalfravik er oft birt sem eitt Z gildi Spurt er: Hverjar eru líkurnar á að eitt úrtak af stærð 100 úr þessu þýði gefi meðaltal sem er á bilinu 134 til 146? Lykill hér að vita að 134 er tveimur staðalfrávíkum undir meðaltali. Hér erum við að tala um er staðalfrávikum úrtakadreifingar. Tvö staðalfrávik undir meðaltali jafngildir - 2 (tveimur) Z gildum Við þurfum oft að reikna þetta Z gildi með formúlu (sjá síðar)
H0 : Núlltilgáta H1 : Rannsóknartilgáta Segir að enginn munur sé á meðaltölum í þessum 2 þýðum Munur sem fram kemur er tilkominn vegna tilviljunarúrtaks H1 : Rannsóknartilgáta Segir að munur sem kemur fram sé tilkominn vegna þess að það sé raunverulegur munur á meðaltölum í þessum tveimur þýðum.
Svör dæmi 8.1 Alpha Form Z(critical) .05 Einhliða Rétt svar er 1,65 .10 Tvíhliða Rétt svar er 1,65 .06 Tvíhliða Rétt svar er 1,88 .01 Einhliða Rétt svar er 2,33 .02 Tvíhliða Rétt svar er 2,33 SP8.1b Alpha Form N (fjöldi í þýði) t(critical) .10 Tvíhliða 31 Rétt svar er 1,697 .02 Tvíhliða 24 Rétt svar er 2,492 .01 Tvíhliða 121 Rétt svar er 2,617 .01 Einhliða 31 Rétt svar er 2,457 .05 Einhliða 61 Rétt svar er 1,671
Einhliða og tvíhliða próf
Kafli 8 Ýmist notast við Z próf eða t-próf Z próf er einfaldara og því reiknað þegar það á við sérstaklega í höndunum. Notum t-próf (one sample t-test) þegar við vitum ekki sigma (staðalfrávik þýðis) og þegar N < 100 Í SPSS notum við nánast alltaf t-próf því Z og t-próf renna saman þegar N > 100 (sumir miða við 120)
Klára 8. kafla með formúlu á tússtöflu Z obtained for proportions Ef við vitum hlutfall í þýði og viljum vita hvort hópur (annað þýði, undirhópur) er með annað hlutfall þá er þessi formúla notuð (teikna á tússtöflu): Zreiknað=Ps-Pu /(SQR(Pu(1-Pu)/N) Dæmi bls. 205 Z er reiknað þegar N er stórt. Bókin glímir ekki við próf fyrir hlutföll með smáu N þess vegna sleppum við því líka.
8. kafli Öll grunnatriði í marktektarprófum kynnt í kafla 8. Núlltilgátan segir að ekki sé munur. Hvort heldur sem um er að ræða hlutföll eða meðaltöl Flest tölfræðipróf felast í að finna líkurnar á niðurstöðu úrtaks komi fram ef núlltilgátan er rétt. Fimm skrefa ferlið er grunnur af tölfræðiprófum í námskeiðinu og bókinni. Breytilegt frá einu próf til annars hvað fer í hvert skref. Ef við getum spáð fyrir um stefnu sambandsins (a er hærri en b) frekar er bara að það sé munur (a er ekki jafnt og b) þá erum við með einhliða próf (one tail test).
8. kafli Rannsakandi getur gert tvennskonar villur (í viðbót við klaufavillur) í tilgátuprófum Alpha (tegund 1) villu þegar við höfnum núlltilgátu þegar hún er rétt . Höfnunarvilla Beta (tegund 2) villu þegar við höfnum ekki núlltilgátu þegar hún er röng. Fastheldnisvilla
Fjalla almennara um tilgátuprófun Fimm skref tilgátuprófunar Z(vendi) og Z(reiknað) Einhliðapróf og tvíhliðapróf Type 1 (alfa) og Type 2 (beta) error Höfnunarmistök og fastheldnimistök
Upprifjun Við notum kenninguna um úrtakadreifingu sem grunn til að meta líkur á að úrtak komi úr tilteknu þýði eða ekki. Eða hvort tveir hópar (tvö úrtök) komi úr sama þýði Við notum það til að meta hvort tölfræðilega marktækur munur sé á milli hópa
Við byrjum á því að reikna Tölfræðipróf fyrir einn hóp. One sample Meðaltal eins úrtaks borið saman við meðaltal þýðis þegar það er vitað. Afar sjaldgæft að við vitum meðaltal þýðis Gagnlegt að byrja á einföldu prófi sem fyrsta skref inn í heim tilgátuprófunar
Tilgátuprófun Tilgátuprófun hjálpar okkur að að álykta um mælanlegan mun milli hópa Nokkur dæmi: Gengur stúlkum betur í námi en piltum? Líður börnum einstæðra forledra verr í skóla en börnum þar sem tveir forledrar eru í heimili? Eru karlar með hærri laun en konur? Eða er þetta bara flökt í úrtaki?
Eru börn unglingsmæðra líklegri til að eignast börn á unglingsárum en aðrir? Er sálfræðiaðtoð árangursríkari en læknisaðstoð sem meðferð við depurð? Er dánartíðni hærri í löndum þar sem ríkir ójöfnuður?
Úrtakadreifing, Z gildi og krónur
Ef við tökum eitt úrtak N=100, hverjar eru líkurnar á því að þetta eina úrtak sé með meðaltal: Lægra en 134 kr? Hærra en 146 kr? Annað hvort lægra en 134 kr eða hærra en 146kr. Hærra en 149 kr? Lægra en 128 kr?
Tilvísun í úrtak björgunarsveitarfólks og aldur Íslendinga frá í síðasta tíma. Ef við vitum meðaltal og staðalfrávik í þýði þá getum við metið líkur þess að eitt tiltekið úrtak sem við tökum komi úr þessu tiltekna þýði. Við setjum fram tvær tilgátur sem skýringu þess að meðaltal úrtaks (úrtak björgunarsveitar- manna) er annað en meðaltal þessa tiltekna þýðis (allra Íslendinga).
H1 og H0 Fyrri tilgátan, rannsóknartilgátan, H1, er að það sé raunverulegur aldursmunur á félögum í björgunarsveit og fullorðnum Íslendingum. Seinni tilgátan, núlltilgátan, H0 er að það sé enginn raunverulegur munur heldur sé sá munur sem mælist hafi tilkomið vegna tilviljunar.
Tilgátuprófun Gengur út á að reyna að hafna H0 Ýmist hafnar rannsakandi H0 eða tekst ekki að hafna H0 Ef að það eru litlar líkur á að H0 sé sönn (minni líkur en alfamörkin. Alfa er oft 0,05) Ef það eru minni en 5% líkur á að eitt úrtak úr þessu þýði sé með svo hátt eða látt meðaltal þá höfnum við núlltilgátunni.
Fimm stig tilgátuprófunar 1. Setjum fram forsendur okkar. Könnum hvort kröfum tölfræðiprófs séu fullnægt. 2. Setjum núlltilgátu fram með formlegum hætti 3. Veljum úrtakadreifingu og finnum critical region, höfnunarsvæði. Sem dæmi, þá er höfnunarsvæði það svæði úrtakadreifingar sem er handan (beoynd) 1,96 eða -1,96
4. Reikna prófið 5. Taka ákvörðun og túlka niðurstöður prófsins
1. Forsendur og kröfur prófsins Er t.d. meðaltal við hæfi fyrir þessa breytu. Er úrtakið tilviljunarúrtak? (random) Er N nægilega stórt fyrir þetta tiltekna próf? Vitum við meðaltal þýðis og staðalfrávik þýðis?
Setjum fram tilgátur Dæmi í bók: H0 : μ = 7.2 H1 : μ ≠ 7.2 Dæmi úr síðasta tíma: H0 : μ = 45,47 H1 : μ ≠ 45,47
Veljum úrtakadreifingu og finnum höfnunarsvæði Ef við styðjumst við normaldreifinguna þá er svokallað Z-próf við hæfi Stærð höfnunarsvæðis er jöfn alfa. Z critical = er það Z gildi sem afmarkar höfnunarsvæði. Z critical er nefnt Z (vendi) á íslensku Z (vendi) er 1,96 ef við erum með alfa mörk = 0,05 og tvíliða próf
Einhliða eða tvíhliðapróf? Dæmi um tvíhlíðapróf H1 : μ ≠ 7,2 (þ.e. μ er annað hvort hærra eða lægra en 7,2, tvær áttir) Dæmi um einhliðapróf H1 : μ 〉 7.2 Annað dæmi: H1 : μ 〈 7.2
Reiknum prófið Í þessum kafla reiknum Z gildi og berum saman við Z(vendi). (formúla 8.1 í kennslubók, bls 186) Z (reiknað)= Berum Z(reiknað) saman við Z(vendi)
Ef Z (reiknað)er handan Z (vendi) (beyond) Það er lægri ef við erum með Z (vendi) sem er mínus tala [t.d. Z (vendi) = -1,65] Hærri ef við erum með Z (vendi) sem er plústala Ef Z (reiknað)er handan Z (vendi), þá er H0 hafnað og ályktað að úrtakið sé tekið úr öðru þýði en það sem borið er saman við Þá er um tölfræðilega marktækan mun að ræða. Marktækur munur á meðaltali þýðis og meðaltali úrtaks.
Tökum ákvörðun Ef Z (reiknað)er handan (beyond) Z (vendi) þá lendir prófgildi á höfnunarsvæði höfnum við núlltilgátu Túlkun felur í sér tilvísun í hvort það sé tölfræðilega marktækur munur á hópum og að úrtakið sé þar með ekki tekið úr sama þýði
Table 8.1 Ef gildi prófsins (test statistics) er í höfnunarsvæðinu, (handan Z (vendi)) þá höfnum við H0, núlltilgátu, munurinn er tölfræðilega marktækur Ef gildi prófsins (test statistics) er ekki í höfnunarsvæðinu, (ekki handan Z (vendi)) þá höfnum við ekki H0, núlltilgátu, munurinn er ekki tölfræðilega marktækur
Einhliða eða tvíhliða próf Alfa segir til um stærð critical region Höfnunarsvæði er = alfa. T.d. Ef alfa er = 0.05 þá er höfnunarsvæðið 5% af flatarmáli undir kúrfunni Staðsetning höfnunarsvæðis (critical region) ræðst af því hvort við erum með einhliða eða tvíhliða próf. Við munum að tvíhliðapróf með alfa = 0.05 afmarkast af tveimur Z gilduM [Z (vendi)], þ.e. 1,96 og -1,96 34
Hér er höfnunarsvæðinu, 0,05 skipt á 2 hliðar kúrfunnar, því tvíhliðapróf Þá er Z (vendi), - 1,96 og +1,96
Þegar við erum með einliðapróf Þá er allt höfnunarsvæði sömu megin, á einni hlið normalkúrfunnar. Þá erum við bara með Z (vendi) Öðru megin, og því miðum við líka við annað gildi. Það er það Z gildi sem gefur area beyond Z = 0,05
Bls 193 tafla 8.2 H1 : μ ≠ Tvíhliða H1 : μ 〉 Einhliða H1 : μ〈 Einhliða Ef alfa = 0.05 H1 : μ ≠ þá er Z (vendi) = +/- 1,96 H1 : μ 〉 þá er Z (vendi) = + 1,65 H1 : μ〈 þá er Z (vendi) = - 1,65
Tafla 8.3 bls 193 sýnir Z(vendi) Fyrir önnur alfa mörk. T.d. 0,1 0,01 0,001
Dæmi úr bók bls 193 Meðaltal allra nemenda í tilteknum skóla er 17,3 og staðalfrávik (þýðis) er 7,4. Meðaltal 100 félagsfræðinemenda mælist 19,2 Mæling á sophistication (líklega tilbúið dæmi)
Fimm skrefa tilgátuprófun 1. Forsendur: Það er búið að reikna meðaltal þannig við gerum ráð fyrir að um sé að ræða jafnbila-hlutfallskvarða Úrtakið er 100 því getum við gert ráð fyrir að úrtakadreifing sé normaldreifð samkvæmt central limit theorem. (Úrtakið nægilega stórt)
2. Setja fram 0 tilgátu H0 : μfélagsfr = 17,3 H1 : μfélagsfr 〉 17,3 Það er í raun skylda að setja fram tilgátu áður en meðaltal hóps er reiknað.
3. Velja úrtakadreifingu og skilgreina höfnunarsvæði Við lögðum af stað með alfa = 0,05 Áður samþykktum við að úrtakadreifing væri normaldreifð Prófið er einhliða (H1 er með stefnu í eina átt) Þá er Z (vendi) = 1,65 (sjá töflu 8,2)
4, reiknum prófið (z próf) Reiknuð (reiknað) Z obtained (19,2-17,3) / (7,4 * 10) = 2,57 10 er kvaðrat rót af 100 Er Z (reiknað) stærra eða minna en Z (vendi)?
Tökum ákvörðun Z (reiknað)er stærra en Z (vendi) Félagsfræðinemar í þessu dæmi eru því marktækt hærri á þessum ágæta kvarða en nemendur skólans. Þeir eru hærri að meðaltali.
Að velja alfa mörk Þegar við höfnum núlltilgátu þá erum við að segja að niðurstaða (t.d. meðaltal úrtaks) sé mjög ólíklega komið úr tilgreindu þýði Með því að velja alfamörk þá erum við að segja hvað við eigum við með óliklegt Við gætum í 5% tilfella verið að hafna H0 tilgátu þegar tilgátan er í raun og veru sönn.
Af hverju ekki að lækka alfamörk og minnka líkur á að við gerum þessi mistök? Því þetta eru ekki einu mistökin sem við getum gert í tilgátuprófun Tafla 8,5
Við getum ekki samtímis minnkað líkur á að Villa af gerð 1 komi fram og líka minnkað líkur á að villa 2 komi fram
Normaldreifingin er ekki eina dreifingin Dreifingin sem lýsir úrtakadreifingu. t-dreifing ef N er lægra en 100. t-dreifing tekur breytingum eftir því hversu úrtakið er stórt. Þegar úrtak er stórt eru t-dreifing og Z-dreifing nánast eins Þess vegna er oft reiknað t-próf sama hvað úrtakið er stórt
t-dreifing Er breytileg eftir úrtaksstærð t-taflan er sett fram á allt annan hátt en Z taflan. Í raun eru gefin upp t-vendi fyrir ýmis alfa mörk. Bæði einhliðapróf og tvíhliðapróf.
t-próf t-próf er oft til að mæla hvort tölfræðilega marktækur munur sé á meðaltali tveggja hópa t-próf er til í nokkrum útgáfum Algengt að nota 2 óháð úrtök (independent sample t-test) Parað t-próf er notað ef stök í hópunum eru tengd. Dæmi ef við erum að skoða launamun karla og kvenna og við spyrjum hjón (karl og konu) One sample. Ef meðaltal þýðis er þekkt.
Dæmi um t-próf í SPSS t-próf er til í nokkrum útgáfum og undirtegunduim. Þetta er t-próf tveggja óskyldra úrtaka. Fyrsti hluti prófsins metur hvort dreifingin sé eins I báðum hópum. Um það bil jöfn dreifing í hópunum er forsenda þess að nota efri línuna í því sem eftir fer Ef einhliða próf þá taka þetta p gildi og deila með 2.
Ef t reiknað er handan t vendi þá er p gildi lægra en 0,05 og munurinn marktækur Ef þetta fyrra próf er marktækt. Þá lesum við úr neðrí línunni af því sem á eftir fer. Það er marktækt ef p gildi er lægra en alfa mörk (0,05) Ef einhliða próf þá taka þetta p gildi og deila með 2.
Ef tími er til sýna formúlu fyrir One sample test for proportion. Bls 207. Formúla 8.3