PRIKUPLJANJE PODATAKA I OSNOVE OBRADE

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Napisala Borka Jadrijević
Advertisements

7 SILA TRENJA.
Laboratorijske vježbe iz Osnova Elektrotehnike 1 -Jednosmjerne struje-
STATISTIČKO OBILJEŽJE
POSLOVNA STATISTIKA.
TRIGONOMETRIJSKE FUNKCIJE
PTP – Vježba za 2. kolokvij Odabir vrste i redoslijeda operacija
INDINŽ Z – Vježba 2 Odabir vrste i redoslijeda operacija
Numeričke deskriptivne veličine
ANALIZA GREŠAKA U MERENJU Analiza i poređenje rezultata merenja vežba 1.1 Dušan Jovanović 55/06.
Naziv predmeta: Istraživanje tržišta
BROJ π Izradio: Tomislav Svalina, 7. razred, šk. god /2016.
NASLOV TEME: OPTICKE OSOBINE KRIVIH DRUGOG REDA
Mjerenje tlaka Prof. dr. Zoran Valić Katedra za fiziologiju
Čvrstih tela i tečnosti
SPSS 1.OPIS KATEGORIČKE VARIJABLE 2.OPIS NUMERIČKE VARIJABLE
TRANSLACIJA (DEGENERACIJA)
Toplotno sirenje cvrstih tela i tecnosti
POLINOMI :-) III℠, X Силвија Мијатовић.
ELEKTRONSKA MIKROSKOPIJA U ISTRAŽIVANJU METALA
Unutarnja energija i toplina
Funkcije u Excelu Lovorka Muminović.
Kako određujemo gustoću
Opšta metodologija uvod
Vijetove formule. Rastavljanje kvadratnog trinoma na linearne činioce
TROUGΔO.
3. Uzimanje uzoraka i obrada analitičkih podataka
Vijetove formule. Rastavljanje kvadratnog trinoma na linearne činioce
Diskriminaciona analiza
JEDNAČINA PRAVE Begzada Kišić.
Elektronika 6. Proboj PN spoja.
Analitička statistika Testiranje hipoteze
FORMULE SUMIRANJE.
Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa
Normalna raspodela.
MAKROEKONOMIJA Poglavlje 6 „TRŽIŠTE RADA”
Strujanje i zakon održanja energije
Osnove statistike Kombinatorika i vjerojatnost
Potencije.
Zašto neka tijela plutaju na vodi, a neka potonu?
Izradila: Ana-Felicia Barbarić
SPLAJN Kubični.
UVOD Pripremio: Varga Ištvan HEMIJSKO-PREHRAMBENA SREDNJA ŠKOLA ČOKA
Polarizacija Procesi nastajanja polarizirane svjetlosti: a) refleksija
Potenciranje i korjenovanje komleksnih brojeva
10. PLAN POMAKA I METODA SUPERPOZICIJE
Spisi prije Biblije Kozmogonijski mitovi Bliskog Istoka
Booleova (logička) algebra
ANALIZA VREMENSKIH NIZOVA
Što je metalurgija, a što crna metalurgija?
Prisjetimo se... Koje fizikalne veličine opisuju svako gibanje?
Dan broja pi Ena Kuliš 1.e.
8 Opisujemo val.
SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET RIJEKA Odabrana poglavlja inženjerske matematike   Usporedba varijanci dvaju osnovnih skupova PREDAVAČ:
POUZDANOST TEHNIČKIH SUSTAVA
8 GIBANJE I BRZINA Za tijelo kažemo da se giba ako mijenja svoj položaj u odnosu na neko drugo tijelo za koje smo odredili da miruje.
ANALIZA GREŠAKAU MJERENJU UPOREDNA ANALIZA REZULTATA Ana Đačić 62/07
Unutarnja energija Matej Vugrinec 7.d.
8 OPTIČKE LEĆE Šibenik, 2015./2016..
N. Zorić1*, A. Šantić1, V. Ličina1, D. Gracin1
Osnove statistike Kombinatorika i vjerojatnost
Tomislav Krišto POSLOVNA STATISTIKA Tomislav Krišto
Pi (π).
STATISTIKA 3. CIKLUS Individualni indeksi Skupni indeksi
Kratki elementi opterećeni centričnom tlačnom silom
Balanced scorecard slide 1
DAN BROJA π.
-je elektromagnetsko zračenje koje je vidljivo ljudskom oku
Tehnička kultura 8, M.Cvijetinović i S. Ljubović
OŠ ”Jelenje – Dražice” Valentina Mohorić, 8.b
Μεταγράφημα παρουσίασης:

PRIKUPLJANJE PODATAKA I OSNOVE OBRADE Darko Hren, prof. Croatian Medical Journal Medicinski Fakultet u Zagrebu

CILJ ISTRAŽIVANJA Opisati Objasniti Predvidjeti uzorak populacija statistička obrada

UZORAK Kakvo je stanje u populaciji? Nereprezentativan Nezavršena Više ili visoko obrazovanje 12% Nezavršena osnovna škola 19% Osnovna škola 22% Srednja škola 47% Kakvo je stanje u populaciji? Nereprezentativan Reprezentativan Nereprezentativan

UZORAK Vrste uzoraka (načini uzimanja uzoraka) Slučajni Sustavni Svaki član populacije ima jednaku vjerojatnost biti odabran (izvlačenje brojeva iz šešira, tablice slučajnih brojeva, računalni programi...) Sustavni Uzima se svaki n-ti član populacije Stratificirani Populacija se dijeli na “slojeve” pa se iz njih uzimaju slučajni uzorci Slučajni uzorak – daje veliku vjerojatnost reprezentativnog uzorka (često preskupo ili nemoguće) Sistematski – oblik slučajnog uzorka – ima smisla samo ako je lista sastavljena bez smislenog sustava Stratificirani – često bolja reprezentativnost nego kod slučajnog uzorka Klaster – lošija verzija slučajnog uzorka (djelomično i strat.) Kvotni – još lošiji (zapravo neslučajni stratificirani) Prigodni – često jedina mogućnost, može biti sasvim u redu ali paziti na probleme (npr. Psihijatar procjenjuje % frigidnih žena) Prigodni Podatci se uzimaju od ispitanika koje imamo “pri ruci”

UZORAK Veličina uzorka Snaga istraživanja – Varijabilnost mjerene pojave Željena preciznost mjerenja Snaga istraživanja – vjerojatnost pronalaženja razlike koja zaista i postoji u populaciji Slučajni uzorak – daje veliku vjerojatnost reprezentativnog uzorka (često preskupo ili nemoguće) Sistematski – oblik slučajnog uzorka – ima smisla samo ako je lista sastavljena bez smislenog sustava Stratificirani – često bolja reprezentativnost nego kod slučajnog uzorka Klaster – lošija verzija slučajnog uzorka (djelomično i strat.) Kvotni – još lošiji (zapravo neslučajni stratificirani) Prigodni – često jedina mogućnost, može biti sasvim u redu ali paziti na probleme (npr. Psihijatar procjenjuje % frigidnih žena) Pogreške: alfa – pronašli smo statistički značajnu razliku, a razlike zapravo nema beta – nismo pronašli razliku, a razlika zapravo postoji

OBLIKOVANJE SKUPINA randomizacija Uzorak Kontrolna Eksperimentalna (1 ili više) randomizacija

VJEŽBA Želimo ispitati stavove studenata prema znanosti. Tijekom prvog tjedna upisa, upitnikom od 10 pitanja ispitali smo studente koji su čekali ispred referade. Slučajni? Stratificirani? Sustavni?

LJESTVICE MJERENJA NOMINALNA ORDINALNA INTERVALNA OMJERNA broj stoji umjesto imena (npr. spol – muški=0, žene=1) ORDINALNA brojevi označavaju redoslijed, ali ne znamo KOLIKE su razlike (npr. pokretljivost bolesnika: I nepokretan, II slabo ili ograničeno pokretan, III pokretan) INTERVALNA imamo redoslijed i razlike ali brojčani odnosi ne označavaju odnose u mjerenoj pojavi jer nema apsolutne nule (npr. temperatura – 20ºC nije dvostruko toplije od 10ºC) OMJERNA brojčani odnosi označavaju odnose u mjerenoj pojavi jer postoji apsolutna nula (npr. dužina – 20 cm je dvostruko duže od 10 cm)

VJEŽBA ordinalna omjerna nominalna intervalna omjerna Stupanj opeklina Zbroj bodova na ljestvici stavova prema znanosti (najmanji mogući rezultat je 10, a najveći 50) Dob Brojevi na majicama nogometaša Doza lijeka koji se daje pacijentu (izražena u mg) Stupanj opeklina omjerna nominalna intervalna omjerna

OBRADA PODATAKA: Opis Usporedba Povezanost Kakvo je znanje studenata medicine o EBM? Postoje li razlike u znanju o EBM između studenata različitih godina? Postoji li povezanost između znanja o EBM i prosjeka ocjena?

Srednje vrijednosti i raspršenja OPIS Raspodjela Srednje vrijednosti i raspršenja Dominantna vrijednost (Mode) -najčešći rezultatat- Središnja vrijednost (Median) -središnji rezultatat- Aritmetička sredina (Mean) -prosjek- Raspon Poluinterkvartilno raspršenje Standardna devijacija

1, 2, 2, 3, 3, 4, 4, 4, 4, 4, 5 Dominantna vrijednost (Mode) -najčešći rezultatat- D=4.0 Središnja vrijednost (Median) -središnji rezultatat- C=4.0 Aritmetička sredina (Mean) -prosjek- M=3.27

SREDNJE VRIJEDNOSTI Aritmetička sredina Središnja vrijednost Zbroj svih rezultata Broj rezultata Aritmetička sredina Ovisi o vrijednosti rezultata, pa je osjetljiva na vrijednosti koje jako odstupaju Središnja vrijednost Vrijednost koja se nalazi točno u sredini niza rezultata poredanih po veličini Ne ovisi o vrijednosti rezultata, pa je vrijednosti koje jako odstupaju ne mijenjaju, ali ju može promijeniti broj rezultata Dominantna vrijednost Vrijednost koja se najčešće pojavljuje Ne ovisi ni o vrijednosti ni o broju rezultata

SREDNJE VRIJEDNOSTI I RASPRŠENJA

Q1 Q3 M=6.04, C=6.0, D=6 SD=2.51, Q=4, raspon=10

Q1 Q3 M=4.69, C=4.0, D=3 SD=2.84, Q=5, raspon=10

Q1 Q3 M=7.39, C=8.0, D=11 SD=2.92, Q=5, raspon=10

RASPODJELA PODATAKA C=4 C=4

Pažnja! Možda je pogreška, a možda neistražena pojava! VRIJEDNOSTI KOJE SE JAKO RAZLIKUJU 151 Pažnja! Možda je pogreška, a možda neistražena pojava!

Testiranje normaliteta raspodjele: Kolmogorov-Smirnov test NORMALNA RASPODJELA Testiranje normaliteta raspodjele: Kolmogorov-Smirnov test

DRUGE RASPODJELE Asimetrična udesno Asimetrična ulijevo Stožasta Spljoštena Bimodalna

Aritmetička sredina i standardna devijacija Parametrijska statistika Središnja/dominantna vrijednost i interkvartilno raspršenje/totalni raspon Neparametrijska statistika

IZBOR ODGOVARAJUĆEG STATISTIČKOG POSTUPKA

VJEŽBA 1. Kakvi su stavovi studenata medicine prema znanosti? 2. Postoje li razlike u stavovima prema znanosti između studenata različitih godina? 4. Postoji li povezanost između stavova prema znanosti i prosjeka ocjena? 3. Postoje li razlike u stavovima prema znanosti između studenata i studentica? 5. Postoji li povezanost između stavova prema znanosti s jedne te dobi, prosjeka ocjena i rezultata na testu znanja s druge strane?

1. Kakvi su stavovi studenata medicine prema znanosti?

2. Postoje li razlike u stavovima prema znanosti između studenata različitih godina?

3. Postoje li razlike u stavovima prema znanosti između studenata i studentica?

4. Postoji li povezanost između stavova prema znanosti i prosjeka ocijena?

5. Postoji li povezanost između stavova prema znanosti s jedne te dobi, prosjeka ocijena i rezultata na testu znanja s druge strane?

TUMAČENJE REZULTATA Statistički značajno!!! p<0.05

PRIKAZ p-vrijednosti – tri decimalna mjesta ŠTO ZNAČI “STATISTIČKI ZNAČAJNO”? p<0.05 – 95% sigurnosti da dobivena razlika/povezanost nije posljedica slučaja p<0.01 – 99% sigurnosti da dobivena razlika/povezanost nije posljedica slučaja PRIKAZ p-vrijednosti – tri decimalna mjesta Npr. p=0.024 p=0.007 p<0.001

Statistički značajno ne mora biti i STVARNO značajno!!!

Statistički značajno, ali ne i klinički! PRIMJER Rezultati randomiziranog kontroliranog pokusa pokazuju da je novi lijek u pokusnoj skupini prosječno smanjio dijastolički tlak s 99 mmHg na 96 mmHg, p<0.001 Statistički značajno, ali ne i klinički!

PRIMJER p<0.001

SAMO POKUSOM MOŽEMO UTVRDITI UZROČNOST!!! POVEZANOST NE ZNAČI I UZROČNOST Korelacija između stavova prema znanosti i slušanja kolegija “Uvod u znanstveni rad u medicini” iznosi ρ=0.84, p<0.001 Studenti koji su slušali kolegij vjerojatno imaju pozitivnije stavove prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijih stavova prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijih stavova prema znanosti

PRIKAZ PODATAKA - NAČELA Tablice i slike Svaka tablica / slika mora biti samorazumljiva (bez čitanja teksta) Svaka tablica / slika mora imati naslov – što informativniji Gdje god su podatci statistički obrađeni, podbilješke tablica / opisi slika moraju donijeti osnovne statističke informacije Ne štediti na potrebnim opisima i objašnjenjima legendi (legende – opisne)

PRIKAZ PODATAKA - NAČELA Svaka tablica / slika treba donijeti jednu poruku Ta poruka je odgovor na jedno pitanje koje proistječe iz deduktivne raščlambe hipoteze Prije izbora tablice / slike, mora se točno i jasno definirati što se njome želi reći

TABLICE kategorijske varijable (numerički podatci, prebrojivi), frekvencije... velik broj podataka jednoznači, jasni i informativni naslovi stupaca i redova u tablici u podbilješkama (* † ‡ § ¶...) su navedena objašnjenja (statističkih testova, kratica...) Primjeri: – podatci o ispitanicima (broj, dob, spol, indeks tjelesne mase) – broj bolničkih kreveta, broj liječnika, sestara, tehničara, pomoćnog osoblja na odjelu....

SLIKE – RTG, EKG, PHD, fotografije, zemljovidi, grafovi... Grafovi – vremenski odnos (linijski graf) – odnos proporcija (stupčani graf) – korelacije – apscisa i ordinata uvijek jasno označene (naziv, mjerne jedinice)

TABLICA VS. SLIKA Slika Tablica RTG, PHD, EKG... numerički podatci linijski graf - vremenski odnos stupčani graf -odnos proporcija Tablica numerički podatci veliki broj podataka podatci o ispitanicima (BMI, dob, spol...), broj bolničkih kreveta, broj muških bolesnika...

Racionalan prikaz podataka u tablici: Pretvaranje dvaju stupaca u jedan broj pacijenata postotak pacijenata No. (%) of patients 43 34.4% 43 (34.4) 27 21.6% 27 (21.6) 32 26.1% 32 (26.1) 17 ... ... 6 Uporaba nadnaslova za stupce Broj (%) pacijenata broj (%) pacijenata broj (%) pacijenata koji su dobili infarkt koji nisu dobili infarkt s infarktom bez infarkta 17 (12.4) 74 (78.3) 17 (12.4) 74 (22.8)

Raspored podataka u tablici Organizirati podatke tako da se srodni elementi slažu u stupac, a ne u red (npr. dob, spol, srednji tlak, težina infarkta) Stupce slažite ovom logikom: DOBSPOL SIMPTOMI FIZIKALNI NALAZ RTG NALAZ TERAPIJA ISHOD Nastojte stupac s p vrijednostima staviti između stupaca s vrijednostima koje uspoređujete P vrijednosti možete staviti i u redove ako uspoređujete podatke koji stoje jedni iznad drugih P vrijednosti uvijek pišite na tri decimale, bez obzira na to je li razlika značajna