Biostatistică aplicată în sănătatea publică
Statistica Este ştiinţa care se ocupă cu culegerea, clasificarea, descrierea, analiza, interpretarea şi prezentarea datelor observate sau calculate în prealabil
Componentele statisticii Statistica descriptivă şi statistica analitică care se ocupă cu măsurarea sumară a datelor Statistica vitală care constituie o colecţie a datelor privind evenimente vitale ale unei populaţii cum ar fi: naşterile, decesele, căsătoriile sau date cu referire la starea de sănătate şi/sau boli raportate prin ASP sau MSP
Utilitatea statisticii Trei funcţii importante: - este o metodă ştiinţifică folosită în interpretarea datelor obţinute prin alte metode - constituie un puternic suport pentru alţi determinanţi ai cauzalităţii ştiinţifice - Raţionamentul statistic este implicat în toate judecăţile ştiinţifice clinice
Date statistice (valori sau variante) Orice material care serveste ca baza pentru luarea unor decizii Constituie obiectul de studiu al statisticii Se refera la valorile individuale prezente , masurate si observate
Caracteristicile datelor (I) Datele pot fi obtinute din intreaga populatie sau din esantioane O populatie: un univers al unitatilor sau valorilor pe care vrem sa le studiem: indivizi, obiecte, evenimente, observatii Un esantion: o parte selectata dupa o anumita schema din intreaga populatie
Caracteristicile datelor (II) Datele pot fi negrupate sau grupate - datele negrupate sunt prezentate prin observatiile individuale ex. Lista de greutati a 6 barbati:70,75, 80,90,88,77 - datele grupate sunt prezentate prin grupuri constand din date identificate prin prezenta lor ex. Greutati mai mari de 80 (3 persoane) si mai mici de 80 (3 persoane)
Caracteristicile datelor (III) Datele pot fi cantitative sau calitative. datele cantitative sunt numerice sau bazate pe numere.Datele cantitative sunt prezentate in distributii de frecventa (serii de variatie) datele calitative sunt date nenumerice sau bazate pe o scala categoriala.Ex exprimarea inaltimii intermeni:scund, mediu, inalt Se exprima de regula in tabele statistice de tip 2x2
Caracteristicile datelor (IV) Datele pot fi discrete (discontinue)sau continue. datele discrete sunt datele pentru care categoriile sunt distincte si exista un numar limitat de valori posibile ex. Nr. De copii dintr-o familie. Toate datele calitative sunt date discrete. datele continue sunt date pentru care exista un numar nelimitat de valori posibile ex. Greutatea individului 78,5 kg
Caracteristicile datelor (V) Calitatea masurarii datelor este definita in termeni de acuratete, validitate, precizie si siguranta a datelor Acuratetea datelor inseamna masura in care masuratoarea efectuata masoara valoarea adevarata a variabilei in studiu. Validitatea datelor inseamna masura in ceea ce se masoara este exact ca trebuie masurat. Precizia datelor inseamna masura in care masuratoarea efectuata este consistenta si reproductibila. Siguranta datelor inseamna masura in care masuratoarea este stabila si demna de incredere
Distributii de frecventa Este o suita completa a valorilor sau proportiilor unei caracteristici pentru o serie de date dintr-un esantion sau dintr-o populatie O distributie este formata din doua coloane si anume: - coloana valorilor ordonate, masurate privind caracteristica studiata – notate cu xi pentru a ne atrage atentia ca este o varianta - coloana frecventelor absolute ale variantelor – notate cu fi sau ni
Tipuri de distributii (I) Distributia binomiala este distributia rezultatelor posibile dintr-o serie de date caracterizate prin 2 categorii mutuale exclusive Distributia uniforma sau distributia rectangulara este distributia in cadrul careia toate evenimentele apar cu aceeasi frecventa
Tipuri de distributii (II) Distributia normala sau distributia gaussiana este o distributie continua, simetrica, poate fi definita numai printr-un numar mare de masuratori Distributia log-normala, este o distributie non-normala cand pentru prezentarea grafica este folosita scala aritmetica , dar este normala cand pentru reprezentarea grafica este folosita scala logaritmica Distributia Poisson sau legea evenimentelor rare este folosita pentru descrierea aparitiei evenimentelor rare dintr-o populatie numeroasa
Statistica descriptiva A. Masurarea tendintei centrale se face printr-o serie de indicatori care descriu valorile de la mijlocul unei distributii de frecventa; acesti indicatori dau o masura sumara a distributiei respective. Seriile pot consta din esantioane de observatii sau observatii asupra intregii populatii si variantele pot fi grupate sau negrupate. In continuare ne vom referi la valorile negrupate.
Media aritmetica Sau valoarea medie este suma tuturor valorilor seriei divizata prin numarul valorilor seriei. Aplicatii si caracteristici: este utila in orice calcul analitic asupra seriei este influentata de toate valorile seriei, inclusiv de cele extreme
Media aritmetica Calcul: x=Σxi/n x=media aritmetica Σ=suma valorilor Xi=valorile individuale n=numarul valorilor in cadrul seriei
Valoarea mediana sau Mediana Este valoarea care imparte seria in 2 grupuri egale, astfel incat jumatate din valori sunt mai mici decat mediana si jumatate sunt mai mari decat mediana. Este cuartila de mijloc, cuartilele fiind valori care impart seria in 4 grupe, sau este percentila de mijloc, percentilele fiind valori care impart seria in 10 grupe egale.
Aplicatii si caracteristici ale medianei Mediana nu este influentata de valorile extreme ale seriei, prin urmare, in cadrul unei serii cu valori extreme aberante, mediana este o masura mult mai reprezentativa a tendintei centrale decat media aritmetica. Nu este folosita in calculele analitice
Calculul medianei Pentru o seie cu numar impar de valori, valorile seriei sunt in ordine crescatoare si valoarea care imparte seria in doua parti egale este mediana. Pentru o serie cu numar par de valori, sunt determinate 2 valori care impart seria in 2 parti egalesi mediana va fi media aritmetica a acestor 2 valori centrale O metoda alternativa este sa determinam 50% din valori pe curba frecventelor cumulate.
Valoarea modala sau modulul Este valoarea corespunzatoare frecventei maxime din cadrul seriei de variatie. O serie poate avea una sau mai multe valori modale;in acest caz se vorbeste de serie unimodala, bimodala, trimodala etc.
Aplicatii si caracteristici ale modulului Este folosit in lucrarile de epidemiologie practica pentru a determina varful incidentei bolilor in cadrul anchetelor de incidenta si prevalenta. Este cel mai dificil indicator pentru masurarea tendintei centrale. Se calculeaza prin observarea valorii sau valorilor care apar cel mai frecvent in cadrul seriei de valori.
Media geometrica Este radacina de ordinul n a produsului celor n valori din cadrul seriei de variatie. Este mult mai usor de calculat, calculand mai intai logaritmul valorilor, apoi media aritmetica a logaritmilor si in final antilogaritmul mediei aritmetice a logaritmilor va fi media geometrica necesara.
Aplicatii si caracteristici Este mai folositoare si mai reprezentativa ca media aritmetica cand descriem o serie de valori fractionare. Poate fi folosita numai pentru valori pozitive Este mai dificil de calculat in comparatie cu media aritmetica GM=antilog{(1/n)[Σ(logxi)]}
Masurarea dispersiei Se face printr-o serie de indicatori care descriu variatia si raspandirea unei serii de valori.
Amplitudinea Este diferenta dintre valoarea cea mai mare si valoarea cea mai mica din cadrul unei serii. Se mai numeste amplitudine absoluta. Amplitudinea relativa se calculeaza prin raportarea amplitudinii absolute la valoarea medie a seriei si inmultim cu 100.
Aplicatii si caracteristici Este folosita pentru a masura paleta de imprastiere a valorilor unei serii statistice Nu ofera informatii privind gradul de imprastiere a valorilor unei serii statistice Este calculata scazand valoarea cea mai mica a unei serii din valoarea cea mai mare a seriei.
Varianta Este suma patratelor diferentelor dintre variante si media aritmetica a lor impartita la numarul variantelor -1 Utilitatea principala este folosirea sa in calculul deviatiei standard V=Σ(xi-x) la patrat/n-1
Deviatia standard Este radacina patrata pozitiva a variantei. Este indicatorul cel mai utilizat pentru masurarea dispersiei unei serii de variatie Se calculeaza prin formula: SD=+√V
Coeficientul de variatie Este raportul dintre deviatia standard a seriei si media aritmetica a seriei x100. Nu are unitate de masura si poate fi exprimat procentual. Este folosit pentru a compara variatia relativa sau imprastierea distributiilor diferitelor serii, esantioane sau populatii sau a diferitelor caracteristici ale unei singure seriei.
Grafice sau prezentarea prin imagini a datelor Sunt alaturi de tabele cele mai sugestive modalitati de prezentare a datelor. Au calitatea de a prezenta intr-o forma simpla fenomenele studiate Elementele de baza ale uni grafic sunt: - titlul reda continutul graficului - scara de reprezentare - reteaua graficului – retelele rectangulare
Tipuri de reprezentari grafice Diagrame Reprezentari grafice pe harta – se folosesc pentru a exprima distributia nivelurilor unui fenomen pe un teritoriu geografic. Se utilizeaza cartogramele si carodiagramele.
Diagramele Sunt reprezentari grafice prin suprafete si prin linii si pot fi: - diagrame prin coloane - diagrama prin benzi - diagrama structurala - diagrama liniara sau histograma - diagrama de distributie cantitativa - diagrama cumulativa