UNIVERSITATEA DE MEDICINA SI FARMACIE “Victor Babeş” TIMISOARA DISCIPLINA DE INFORMATICA MEDICALA http://moodle.umft.ro/moodle
ESTIMAREA STATISTICA TESTE STATISTICE CURSUL 4 ESTIMAREA STATISTICA TESTE STATISTICE 2 2 2 2
Capitolele biostatisticii Inferenta statistica Statistica descriptiva - Parametrii statistici Estimarea statistica Teste statistice Corelatia si regresia Prelucrări avansate (Analiza clasificării etc) Aplicaţii speciale: Epidemiologie (Analiza riscului) Aplicaţii în demografie (Analiza supravietuirii) Sănătate publică (Statistica sanitară)
1. ESTIMAREA STATISTICA 2 2 2 2
Reluare exemplu: studiu privind dezvoltarea somatică a copiilor de 10 ani din Timişoara EX: studiu inaltimea copiilor: n=25 copii m=137 cm s=5 cm p = proportia indivizilor care au marimea in intervalul respectiv p = probabilitatea ca un individ sa aiba marimea in intervalul respectiv
DISTRIBUTIA NORMALA (GAUSS) REPREZENTARE GRAFICA [Valori individuale]
1.1. Conceptul de estimator Ex. Pentru POPULATIE Ex: “Care este inaltimea medie a copiilor din Timisoara?” Caracteristicile populatiei – prin “inferenta statistica” Variaţia mediilor eşantioanelor – “variabilitate de eşantionare”
1.2. Distributia mediilor esantioanelor Reprezentare grafica
1.3. Eroarea standard a mediei: sx = s /√ n p = probabilitatea ca media populatiei ( μ ) sa fie situata in intervalul respectiv (se alege conventional p = 95 %) în exemplu: sx = 5 / √ 25 = 1 cm interpretare
1.4. DEFINITII a) DEVIATIA STANDARD = INDICATOR DE DISPERSIE CARE ARATA IMPRASTIEREA VALORILOR INDIVIDUALE IN JURUL MEDIEI ESANTIONULUI b) EROAREA STANDARD A MEDIEI = INDICATOR DE DISPERSIE CARE ARATA IMPRASTIEREA MEDIILOR ESANTIOANELOR IN JURUL MEDIEI POPULATIEI
1.5. Conceptul de estimator - comentarii - Elemente centrale: Valoarea reală a mediei populaţiei rămâne necunoscută – de aici termenul de “estimaţie” NU “ce valoare”, ci “în ce interval” INTOTDEAUNA avem un nivel limitat de incredere (exprimat probabilistic – convenţional 95 %)
EXERCITIU Pentru un grup de N = 36 pacienti cardiaci am gasit media tensiunii sistolice de 150 mm Hg cu o deviatie standard de 12mm. a) In ce interval sunt situate 68% din valorile tensiunii sistolice ale pacientilor? b) In ce interval gasim valoarea medie a tensiunii sistolice cu o probabilitate de 95% ? c) Cati pacienti (in %) au tensiunea sistolica peste 162 mm? 8 8 8 8
1.6. INDICATORI DE DISPERSIE PENTRU VARIABILE NOMINALE Proporţia Clasei: pi = Ni / N (procentul … 100) Eroarea standard a proporţiei: pi – probabilitatea de a aparţine clasei qi – probabilitatea de a nu aparţine clasei 9 9 9 9
1.7. Generalizare TIPURI DE ESTIMARE STATISTICA PENTRU MEDII PROPORTII DIFERENTE (intre medii, proportii) 3 3 3 3
A. ESTIMAREA MEDIEI a) ESANTIOANE MARI N > 30 X = ARE DISTRIBUTIE NORMALA (INDIFERENT DE DISTRIBUTIA INDIVIDUALA) 1 – α - z α/2 68% - 1 90% - 1.65 95% - 1.96 95.4% - 2 99% - 2.58 99.7% - 3
b) ESANTIOANE MICI N < 30 X - ARE DISTRIBUTIE “t” GRADE DE LIBERTATE B. PENTRU PROPORTII Ex: Intr-un studiu privind distributia grupelor sanguine efectuat pe 400 persoane, 144 au avut grupa sanguina A. In ce interval se gaseste procentul celor de grupa A, cu incredere de 95% ? 10 10
1.5. Dimensiunea esantionului se alege “precizia” incadrarii mediei pop. si nivelul de incredere se estimeaza eroarea standard “sx” deviatia standard trebuie cunoscuta: din studii anterioare studiu peliminar metoda celor 6s intre Max si min se calculeaza “n”: n = ( s / sx ) 2 Exemplu: Inaltimea medie a copiilor cu precizie ±2 cm, 1- = 95% Acelasi caz, cu precizie ±1 cm
2. TESTE STATISTICE (I) 2 2 2 2
2.1. DIFERENTE SEMNIFICATIVE SI NESEMNIFICATIVE a) Exemplu: BAIETI n = 25 X = 137 cm s = 5 cm sx = 1 cm (135, 139) ...95% FETE n = 25 X = 138.5 cm s = 5 cm sx = 1 cm D.nesemnificative FETE n = 25 X = 139.5 cm s = 5 cm sx = 1 cm D.semnificative
b) DEFINITII DIFERENTE NESEMNIFICATIVE Au probabilitate mare sa apara din intamplare Cauza: Variabilitatea de esantionare Cele doua esantioane apartin aceleeasi populatii DIFERENTE SEMNIFICATIVE Au probabilitate mica sa apara din intamplare Trebuie atribuite altei cauze 11 11
Diferente nesemnificative
Diferente Semnificative
2.2. TESTE STATISTICE Definitie Procedeu statistic de evaluare a gradului de semnificaţie a diferenţelor între parametrii statistici ai seriilor experimentale Pasi de aplicare IPOTEZE STATISTICE PRAG DE SEMNIFICAŢIE CALCULUL LUI “p” DECIZIA TESTULUI
2.2.A. IPOTEZE STATISTICE a) IPOTEZA DE NUL (DE ZERO) H0 : X1 = X2 (semnul = nu este MATEMATIC ci STATISTIC) Nu sunt diferente semnificative intre cele doua valori (esantioane) b) IPOTEZE ALTERNATIVE H1 : X1 X2 (bilaterala) – cea mai uzuală X1 > X2 , X1 < X2 (unilaterala) 9 9 9 9
2.2.B. PRAG DE SEMNIFICATIE 2.2.C. COEFICIENTUL “P” a) DEFINITIE: valoarea probabilitatii sub care incepem sa consideram diferentele ca semnificative b) VALOARE UZUALA: a = 0.05 = 5 % c) NIVEL DE INCREDERE (confidenta) 1 - a = 0.95 = 95 % 2.2.C. COEFICIENTUL “P” P = probabilitatea ca diferentele observate sa fi aparut din intamplare 13 13
2.2.D. DECIZIA Daca p > 0.05 => Diferente Nesemnificative, (N) , H0 este acceptata Daca p < 0.05 => Diferente Semnificative, (S), H0 este respinsa Daca p < 0.01 => Diferente Foarte Semnificative, (F), H0 respinsa Daca p < 0.001 => Diferente Extrem de Semnificative, (E), H0 respinsa 24 24
2.3. CARACTERISTICILE TESTELOR STATISTICE 2.3.1. ERORI TIP I: H0 = ADEVARATA, DAR RESPINSA TIP II: H0 = FALSA, DAR ACCEPTATA 2.3.2. Increderea (confidenta) testului = 1 - a 2.3.3. Puterea testului = 1 - b (Ele variaza invers proportional) 3 3 3 3
2.4. Clasificarea testelor 2.4.1. Teste Parametrice si Neparametrice Parametrice - pt. variabile distribuite normal Neparametrice - pentru alte distributii 2.4.2. Teste Pereche şi Nepereche 2.4.3. Teste Unilaterale si Bilaterale (dupa Ha) 2.4.4. Clase de Teste Teste de semnificatie – ind. tendintei centrale Teste de omogenitate – ind. dispersie Teste de concordanta - distributii Teste de independenta Teste pentru coeficientul corelatie 8 8 8 8
- pauza - 30 30