ΟΡΓΑΝΩΣΗ & ΠΑΡΟΥΣΙΑΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Σημαντική διαδικασία της επιδημιολογίας η οργάνωση, η ανάλυση και η παρουσίαση των δεδομένων Αρχικά εξετάζει δεδομένα «ακατάστατα» συγκέντρωση αυτών των στοιχείων σε πίνακες Μερικές φορές αυτό είναι αρκετό σε απλά δεδομένα, σε πιο σύνθετα όμως, γραφικές παραστάσεις και διαγράμματα είναι αναγκαία για να αποκαλυφθούν οι σχέσεις μεταξύ των δεδομένων Κύριος στόχος: η ανάδειξη της πληροφορίας που προέρχεται από τα δεδομένα 1
ΟΡΓΑΝΩΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Περιλαμβάνει: Σύνοψη Παρουσίαση, επιλέγοντας τον καταλληλότερο τρόπο Εφαρμογή απλών κανόνων εμφάνισης (σε πίνακες, γραφήματα και χάρτες) 2
ΟΡΓΑΝΩΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (Πίνακας, Γράφημα ή Χάρτης;;;) ΟΡΓΑΝΩΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (Πίνακας, Γράφημα ή Χάρτης;;;) 3
ΟΡΓΑΝΩΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (β) Τύποι-Μέθοδοι παρουσίασης: Πίνακας (με μία, δύο ή τρεις μεταβλητές) Γραφήματα (γραμμή αριθμητικής-ημιλογαριθμικής κλίμακας, ιστόγραμμα, πολύγωνο συχνοτήτων, ραβδόγραμμα, κυκλικό διάγραμμα, σημειόγραμμα, θηκόγραμμα, κτλ.) Χάρτες (χάρτης σημείου, χάρτης περιοχής) Πότε χρησιμοποιείται ο κάθε τύπος παρουσίασης;! 4
ΟΡΓΑΝΩΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (γ) Το είδος των δεδομένων καθορίζει τόσο τη μέθοδο που θα πρέπει να χρησιμοποιηθεί για τη στατιστική ανάλυση όσο και τη μορφή παρουσίασης των δεδομένων Tι θέλουμε να διερευνήσουμε 5
Είδος δεδομένων – τύποι μεταβλητών Περιοχή Αστική, Ημιαστική ή Αγροτική; Αθήνα Λάρισα Βόλος Αγιόκαμπος Λάρισας … 170εκ., 1,70μ., 1,702μ., 1,70221μ. … 6
Είδος δεδομένων – τύποι μεταβλητών π.χ. 56,2 ετών 56 ετών 50-65 ετών Ηλικιωμένος (>65 ετών) (Ναι/Όχι) Συνεχής Διακριτή Διατάξιμη Κατηγορική π.χ. ηλικία, βάρος, θερμοκρασία σώματος, χοληστερόλη, κτλ. 7
ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Χρησιμοποιούνται σε μαθηματικές πράξεις Μπορούν να υπολογιστούν στατιστικά μέτρα (μέση τιμή, τυπική απόκλιση, διάμεσος, διακύμανση, κτλ.) π.χ. μέσο ύψος = 175,2 εκ. Τα αποτελέσματα παρουσιάζονται συνοπτικά σε: Πίνακες στατιστικών περιγραφικών μέτρων Πίνακες κατανομής συχνοτήτων/ποσοστών (αφού τα δεδομένα ταξινομηθούν σε ομάδες) Γραφήματα Χάρτες ΝΑΙ: αθροιστική συχνότητα & αθροιστικά ποσοστά 8
ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Μπορούν να απαριθμηθούν αλλά δεν είναι μετρήσιμα => δεν μπορούν να χρησιμοποιηθούν σε μαθηματικές πράξεις (υπολογισμός μέσης τιμής, διαμέσου, κτλ.) Τα αποτελέσματα παρουσιάζονται συνοπτικά σε: Πίνακες κατανομής συχνοτήτων/ποσοστών Γραφήματα Χάρτες ΌΧΙ: αθροιστική συχνότητα & αθροιστικά ποσοστά 9
ΣΥΛΛΟΓΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Συλλογή δεδομένων από ερωτηματολόγια με: Προσωπική συνέντευξη Τηλεφωνική συνέντευξη Ταχυδρομική συμπλήρωση Ηλεκτρονική συμπλήρωση (email)
ΚΑΤΑΧΩΡΗΣΗ ΕΠΙΔΗΜΙΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Βάσεις δεδομένων (Access) Υπολογιστικά προγράμματα (Εxcel) Στατιστικά προγράμματα (SPSS) Αποφεύγουμε να καταχωρούμε γραμματοσειρές, προτιμούμε αριθμούς Ποιοτικά δεδομένα με αριθμούς;!!! Π.χ. φύλο, πώς θα γίνει η καταχώρηση; άνδρας=1 και γυναίκα=2 Τόπος κατοικίας;;;
ΠΑΡΑΔΕΙΓΜΑ ΚΑΤΑΧΩΡΗΣΗΣ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ
ΠΙΝΑΚΕΣ, ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΧΑΡΤΕΣ Οδηγίες κατασκευής: Κατανοητά Απλά Τίτλος (τι, που, πότε) Επεξήγηση συντομεύσεων και συμβόλων Αναφορά των δεδομένων που αποκλείστηκαν Αναφορά της πηγής των δεδομένων 13
ΠΙΝΑΚΕΣ (για ποιοτικές και ποσοτικές μεταβλητές) Πίνακας είναι ένα σύνολο δεδομένων οργανωμένο σε γραμμές και στήλες Κάθε ποιοτικό και ποσοτικό δεδομένο μπορεί να οργανωθεί σε πίνακα Οδηγίες: Ονόμασε κάθε σειρά και στήλη με σαφήνεια Ανέφερε τις μονάδες μετρήσεως (Συμπεριέλαβε τα αθροίσματα στον πίνακα) 14
ΠΙΝΑΚΑΣ Περιγραφικών Στατιστικών Μέτρων ΠΙΝΑΚΑΣ Περιγραφικών Στατιστικών Μέτρων Ασθενείς Υγιείς Διάμεσος IQR p-value* Μέση ημερήσια κατανάλωση ποτηριών νερού 6 4-7,5 5 4-7 0,532 Mann-Whitney test IQR: ενδοτεταρτημοριακό εύρος 15
ΠΙΝΑΚΑΣ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ Ο πιο απλός πίνακας Η πρώτη στήλη δείχνει τις κατηγορίες της εξεταζόμενης μεταβλητής (π.χ. οικογενειακή κατάσταση, επίπεδο εκπαίδευσης, ηλικιακές ομάδες) Δεύτερη στήλη δείχνει (συνήθως) συχνότητες Συχνά υπάρχει και τρίτη στήλη που δείχνει ποσοστά Μπορεί να υπάρχει και στήλη με την αθροιστική συχνότητα ή τα αθροιστικά ποσοστά 16
Δηλωθέντα κρούσματα Σαλμονέλλωσης κατά ηλικιακή ομάδα, Ελλάδα, 2005 Ηλικιακή ομάδα (σε έτη) Συχνότητα 0-4 440 5-14 264 15-24 59 25-44 104 45-64 88 65+ 119 Άγνωστη 159 Σύνολο χώρας 1233 Πηγή: ΚΕΕΛΠΝΟ 17
Δηλωθέντα κρούσματα Σαλμονέλλωσης κατά ηλικιακή ομάδα, Ελλάδα, 2005 Ηλικιακή ομάδα (σε έτη) Συχνότητα Αθροιστική συχνότητα Ποσοστό Αθροιστικό ποσοστό 0-4 440 35,7 5-14 264 704 21,4 57,1 15-24 59 763 4,8 61,9 25-44 104 867 8,4 70,3 45-64 88 955 7,1 77,5 65+ 119 1074 9,7 87,1 Άγνωστη 159 1233 12,9 100,0 Σύνολο χώρας Πηγή: ΚΕΕΛΠΝΟ 18
ΠΙΝΑΚΑΣ ΔΥΟ ΚΑΙ ΤΡΙΩΝ ΜΕΤΑΒΛΗΤΩΝ Στο προηγούμενο παράδειγμα: θα μπορούσαμε να προσθέσουμε το φύλο ως δεύτερη μεταβλητή, οπότε θα είχαμε ένα πίνακα με μεταβλητές την ηλικία και το φύλο Πίνακας συνάφειας ή πίνακας ταξινόμησης (contingency table) (Πίνακας 2x2, 2x3, 3x2 κτλ.) Ο καλύτερος τρόπος παρουσίασης δεδομένων Ενίοτε εισέρχεται και τρίτη μεταβλητή π.χ. ηλικία, φύλο, εθνικότητα, τόπος διαμονής Οι πίνακες μπορεί να περιέχουν και στατιστικές παραμέτρους: μέση τιμή, σχετικός κίνδυνος (Relative Risk ), Odds Ratio, κτλ. 19
Κατανομή των καπνιστών, Παγκόσμια Έρευνα Καπνίσματος στους Νέους (GYTS), Ελλάδα, 2009 Άνδρες Γυναίκες Σύνολο Ηλικία (σε έτη) Συχνότητα (%) 11 7 (7,8) (10,9) 18 (9,4) 12 5 (5,6) (5,0) 10 (5,2) 13 (13,3) 23 (12,0) 14 (20,0) (22,8) 41 (21,5) 15 34 (37,8) 32 (31,7) 66 (34,6) 16 9 (10,0) (11,9) 21 (11,0) 17 (6,9) (6,3) 90 (47,1) 101 (52,9) 191 (100,0) Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 20
Παράδειγμα: Πίνακας 2x2 (τετράπτυχος πίνακας) Ασθενείς Υγιείς Σύνολο Έκθεση α β α+β Μη έκθεση γ δ γ+δ α+γ β+δ α+β+γ+δ 21
Παράδειγμα: Διερεύνηση σχέσης καπνίσματος και καρκίνου του πνεύμονα, Ν Παράδειγμα: Διερεύνηση σχέσης καπνίσματος και καρκίνου του πνεύμονα, Ν. Λάρισας, 2010 Ασθενείς (%) Υγιείς (%) Σύνολο RR (95%CI) Κάπνισμα Ναι 100 (66,7) 50 (33,3) 150 1,43 (1,16-1,75) Όχι 70 (46,7) 80 (53,3) Αναφορά 170 130 300 Δεν περιλαμβάνεται η μονάδα! Συμπέρασμα: το κάπνισμα αυξάνει τον κίνδυνο εμφάνισης καρκίνου του πνεύμονα 22
ΤΑΞΙΝΟΜΩΝΤΑΣ ΠΟΣΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΣΕ ΚΑΤΗΓΟΡΙΕΣ (α) Αμοιβαία αποκλειόμενες κατηγορίες που περιλαμβάνουν όλα τα δεδομένα Σχετικά μεγάλο αριθμό, μικρών σε μέγεθος, κατηγοριών για την αρχική ανάλυση Φυσικά ή βιολογικά όρια διαχωρισμών, όπου αυτό είναι εφικτό Κατηγορία «αγνώστων» 23
24
ΤΑΞΙΝΟΜΩΝΤΑΣ ΠΟΣΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΣΕ ΚΑΤΗΓΟΡΙΕΣ (β) Στρατηγική 1: Διαίρεσε τα δεδομένα σε 4-8 κατηγορίες ίδιου μεγέθους αριθμό παρατηρήσεων, αφού τα τοποθετήσεις σε μία σειρά (διάταξη), χρησιμοποιώντας τα αντίστοιχα ποσοστημόρια Στρατηγική 2: Δημιούργησε κατηγορίες χρησιμοποιώντας τη μέση τιμή (m) και την τυπική απόκλιση (sd) (π.χ. m±sd ή m±2*sd) Στρατηγική 3: Διαίρεσε τα δεδομένα σε ίσου πλάτους διαστήματα χρησιμοποιώντας τον τύπο: δ: πλάτος διαστήματος των κατηγοριών R: εύρος τιμών των δεδομένων (μέγιστο - ελάχιστο) k: πλήθος (επιθυμητών) κατηγοριών 25
ΓΡΑΦΗΜΑΤΑ – ΔΙΑΓΡΑΜΜΑΤΑ (για ποιοτικές και ποσοτικές μεταβλητές) Οπτικοποίηση των δεδομένων Αποτυπώνουν τη μορφή, τη δομή, την τάση, τις ομοιότητες και τις διαφορές των δεδομένων Οριζόντιος άξονας (άξονας Χ) για την ανεξάρτητη μεταβλητή και κάθετος άξονας (άξονας Ψ) για την εξαρτημένη 26
ΓΡΑΦΗΜΑΤΑ Γραμμή αριθμητικής κλίμακας Γραμμή ημιλογαριθμικής κλίμακας Ιστόγραμμα (ποσοτικά δεδομένα) Επιδημική καμπύλη Πολύγωνα συχνοτήτων (ποσοτικά δεδομένα) Αθροιστικής συχνότητας (ποσοτικά δεδομένα) Καμπύλη επιβίωσης (ποσοτικά δεδομένα) Πληθυσμιακή πυραμίδα (ποσοτικά-ποιοτικά δεδομένα) 27
ΓΡΑΦΗΜΑ ΓΡΑΜΜΗΣ ΑΡΙΘΜΗΤΙΚΗΣ ΚΛΙΜΑΚΑΣ Δεδομένα, συνήθως, στο χρόνο Η απόσταση ανάμεσα σε δύο σημεία αντιπροσωπεύει ίδια «ποσότητα» οπουδήποτε στον άξονα Η κλίμακα που χρησιμοποιούμε ποικίλλει 28
Θάνατοι από Οξύ έμφραγμα του μυοκαρδίου, Ελλάδα, 1999-2008 Πηγή: ΕΛ.ΣΤΑΤ 29
Θάνατοι από Οξύ έμφραγμα του μυοκαρδίου κατά φύλο και σύνολο χώρας, Ελλάδα, 1999-2008 Πηγή: ΕΛ.ΣΤΑΤ 30
ΓΡΑΦΗΜΑ ΓΡΑΜΜΗΣ ΑΡΙΘΜΗΤΙΚΗΣ ΚΛΙΜΑΚΑΣ - ΟΔΗΓΙΕΣ Άξονας Ψ μικρότερος από τον Χ Πάντα να αρχίζει ο Ψ από το 0 Καθόρισε την κλίμακα ώστε να αναδεικνύεται αυτό που θέλουμε Εύρος τιμών στον Ψ 31
ΓΡΑΦΗΜΑ ΓΡΑΜΜΗΣ ΗΜΙΛΟΓΑΡΙΘΜΙΚΗΣ ΚΛΙΜΑΚΑΣ Οι διαιρέσεις στον Ψ είναι σε λογαριθμική κλίμακα Οι διαιρέσεις στον Χ είναι σε αριθμητική κλίμακα Ίσες αποστάσεις στον Ψ αντιπροσωπεύουν ίδιο ποσοστό αλλαγής (ρυθμός μεταβολής) Αναγκαίο όταν πρέπει να περιληφθεί ένα μεγάλο εύρος τιμών σε ένα γράφημα Χρήσιμο για να δείχνει τους ρυθμούς μεταβολής της επίπτωσης ενός νοσήματος σε μια χρονική περίοδο 32
Δηλωθέντα κρούσματα κοκκύτη σε ημιλογαριθμική κλίμακα, Ελλάδα, 1981-2008 Πηγή: ΚΕΕΛΠΝΟ 33
ΓΡΑΦΗΜΑ ΓΡΑΜΜΗΣ ΗΜΙΛΟΓΑΡΙΘΜΙΚΗΣ ΚΛΙΜΑΚΑΣ - ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΓΡΑΦΗΜΑ ΓΡΑΜΜΗΣ ΗΜΙΛΟΓΑΡΙΘΜΙΚΗΣ ΚΛΙΜΑΚΑΣ - ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Μια ανιούσα (κατιούσα) ευθεία γραμμή δείχνει μια σταθερή αναλογία (όχι ποσότητα) ανόδου (καθόδου) των τιμών Μια οριζόντια γραμμή δείχνει ότι δεν υπάρχει μεταβολή Δύο ή περισσότερες παράλληλες γραμμές δείχνουν παρόμοιες αναλογίες μεταβολής 34
ΓΡΑΦΗΜΑΤΑ ΗΜΙΛΟΓΑΡΙΘΜΙΚΗΣ ΚΛΙΜΑΚΑΣ - ΟΔΗΓΙΕΣ Βρείτε την μικρότερη τιμή στον Ψ και τοποθετήστε σε τάξη μεγέθους (1ος κύκλος) Βρείτε την μεγαλύτερη τιμή στον Ψ και τοποθετήστε σε τάξη μεγέθους (τελευταίος κύκλος) Αναγνωρίστε πόσοι κύκλοι απαιτούνται ενδιάμεσα 35
36
ΙΣΤΟΓΡΑΜΜΑ (Histogram) Γράφημα κατανομής συχνοτήτων μίας συνεχούς μεταβλητής Χρήση στηλών που αντιπροσωπεύουν τον αριθμό των παρατηρήσεων Οι στήλες είναι ενωμένες Ο χώρος κάθε στήλης είναι ανάλογος με τον αριθμό των παρατηρήσεων που της αντιστοιχεί Ο οριζόντιος άξονας (άξονας Χ) μπορεί να είναι ο χρόνος αλλά και κάθε συνεχής μεταβλητή 37
Ιστόγραμμα συχνοτήτων των γεννήσεων κατά ηλικία της μητέρας, Ελλάδα, 2009 Πηγή: ΕΛ.ΣΤΑΤ 38
ΙΣΤΟΓΡΑΜΜΑ – Επιδημική καμπύλη Η επιδημιολογική καμπύλη (ή επιδημική καμπύλη) δεν είναι καμπύλη αλλά ιστόγραμμα Δείχνει αριθμό κρουσμάτων μίας επιδημίας (ενδημίας) στο χρόνο (π.χ. ημέρα, εβδομάδα) 39
40
ΠΟΛΥΓΩΝΑ ΣΥΧΝΟΤΗΤΩΝ (Frequency Polygons) Όπως το ιστόγραμμα, είναι γράφημα κατανομής συχνοτήτων μίας συνεχούς μεταβλητής Ο αριθμός των παρατηρήσεων (π.χ. πλήθος κρουσμάτων) σε μία χρονική περίοδο αντιστοιχεί σε ένα σημείο Ενώνονται διαδοχικά τα μέσα των πάνω βάσεων των ορθογωνίων του ιστογράμματος σχηματίζοντας ένα πολύγωνο Χρησιμοποιείται για την ταυτόχρονη σύγκριση δύο ή περισσοτέρων κατανομών συχνότητας 41
42
Κατανομή των γεννήσεων κατά ηλικία της μητέρας, Ελλάδα, 2009 Πηγή: ΕΛ.ΣΤΑΤ 43
Κατανομή των γεννήσεων κατά ηλικία της μητέρας, και τη νομιμότητα του τέκνου, Ελλάδα, 2009 Πηγή: ΕΛ.ΣΤΑΤ 44
ΓΡΑΦΗΜΑ ΑΘΡΟΙΣΤΙΚΗΣ ΣΥΧΝΟΤΗΤΑΣ (Cumulative frequency) & ΚΑΜΠΥΛΕΣ ΕΠΙΒΙΩΣΗΣ (Survival curves) Γράφημα αθροιστικής συχνότητας μιας συνεχούς μεταβλητής Χρήσιμο για την αποτύπωση διαμέσων και ποσοστημορίων Ο κάθετος άξονας (Ψ) δείχνει την αθροιστική συχνότητα και ο οριζόντιος (Χ) τη συνεχή μεταβλητή Καμπύλη επιβίωσης: γράφημα αθροιστικής συχνότητας 45
Μελέτη πασχόντων και μαρτύρων: Διερεύνηση αιματολεμφογενών καρκίνων, N Το 40% των ανδρών τι ηλικίας ήταν; Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 46
Καμπύλη επιβίωσης
Καμπύλες επιβίωσης κατά φύλο Μελέτη πασχόντων και μαρτύρων: Διερεύνηση αιματολεμφογενών καρκίνων, N. Λάρισας, 2003-2006 Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 48
ΠΛΗΘΥΣΜΙΑΚΗ ΠΥΡΑΜΙΔΑ (Population pyramid) Χρησιμοποιείται για την απεικόνιση της δομής και σύνθεσης του πληθυσμού κατά ηλικία και φύλο Ο προς διερεύνηση πληθυσμός μπορεί να είναι π.χ.: το σύνολο μιας χώρας-ενός νομού, ο πληθυσμός με κάποιο συγκεκριμένο νόσημα, το σύνολο των ασθενών που νοσηλεύτηκαν σε ένα νοσοκομείο σε ένα έτος, κτλ. 49
Πραγματικός πληθυσμός κατά ηλικία και φύλο, Ελλάδα, Απογραφή 2001 Πραγματικός πληθυσμός κατά ηλικία και φύλο, Ελλάδα, Απογραφή 2001 Πηγή: ΕΛ.ΣΤΑΤ 50
ΔΙΑΓΡΑΜΜΑΤΑ 51 Διάγραμμα Διασποράς (Scatterplot) (ποσοτικά δεδομένα) Κυκλικό διάγραμμα (Pie chart) (ποιοτικά δεδομένα) Ραβδόγραμμα ((Simple) Bar chart) (ποιοτικά δεδομένα) Ομαδοποιημένο Ραβδόγραμμα (Clustered bar chart) Συσσωρευτικό Ραβδόγραμμα (Stacked bar chart) 100% Ραβδόγραμμα συνιστωσών (100% Component bar chart) Απόκλισης (Deviation bar chart) Θηκόγραμμα (Box plot) (ποσοτικά-ποιοτικά δεδομένα) Σημειόγραμμα (Dot plot) (ποσοτικά-ποιοτικά δεδομένα) Γεωγραφικές κατανομές δεδομένων (ποσοτικά-ποιοτικά δεδομένα) Χάρτες (Maps) Οριζόντιο ραβδόγραμμα (Horizontal bar chart) 51
ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Χρησιμοποιείται για τη γραφική απεικόνιση της σχέσης μεταξύ δύο ποσοτικών μεταβλητών Στον οριζόντιο άξονα (Χ) η ανεξάρτητη μεταβλητή και στον κάθετο (Ψ) η εξαρτημένη Κάθε ζεύγος μετρήσεων ορίζει στο διάγραμμα ένα σημείο Ερμηνεία: Τυχαία κατανομή των σημείων δεν υπάρχει σχέση μεταξύ των δυο μεταβλητών Ύπαρξη μοτίβου/προτύπου υπάρχει σχέση (θετική ή αρνητική) μεταξύ των μεταβλητών Όσο πυκνότερο τόσο μεγαλύτερη συσχέτιση Π.χ. βάρος και ύψος, χρόνος άσκησης και καύσης θερμίδων, κτλ. 52
Παράδειγμα Διαγράμματος Διασποράς: Ημερήσιος χρόνος μελέτης Επιδημιολογίας και βαθμολογίας στις εξετάσεις 53
ΚΥΚΛΙΚΟ ΔΙΑΓΡΑΜΜΑ (Pie chart) Χρησιμοποιείται για τη γραφική απεικόνιση των συχνοτήτων (και των ποσοστών) μιας ποιοτικής μεταβλητής Εύκολο και κατανοητό διάγραμμα Σύγκριση μεταξύ των κατηγοριών της μεταβλητής Το διάγραμμα μπορεί να εμφανίζει το πλήθος και το ποσοστό κάθε κατηγορίας Π.χ. αιτία θανάτου, οικογενειακή κατάσταση, επίπεδο εκπαίδευσης, ηλικιακή ομάδα, κτλ. 54
Σύνολο θανάτων κατά αιτία, Ελλάδα, 2008 55
ΡΑΒΔΟΓΡΑΜΜΑ (ΑΠΛΟ) Χρησιμοποιείται για την απεικόνιση της κατανομής των συχνοτήτων (και ποσοστών) μιας ποιοτικής μεταβλητής Σύγκριση μεταξύ των κατηγοριών της μεταβλητής Μεγαλύτερο ύψος στήλης (ράβδου) μεγαλύτερη συχνότητα Οι στήλες δεν είναι ενωμένες π.χ. αιτία θανάτου, νόσημα, περιοχή, ηλικιακή ομάδα, κτλ. 56
Σύνολο θανάτων κατά αιτία, Ελλάδα, 2008 Πηγή: ΕΛ.ΣΤΑΤ 57
ΟΜΑΔΟΠΟΙΗΜΕΝΟ ΡΑΒΔΟΓΡΑΜΜΑ (Clustered or Grouped bar chart) Γράφημα με δύο ή τρεις ποιοτικές μεταβλητές Χρησιμοποιείται για την απεικόνιση της κατανομής των συχνοτήτων (και ποσοστών) των ποιοτικών μεταβλητών Σύγκριση μεταξύ των κατηγοριών της μιας μεταβλητής για κάθε κατηγορία της άλλης μεταβλητής Ξεχωριστό χρώμα οι ράβδοι για κάθε ομάδα της μεταβλητής που συγκρίνεται Δύσκολη η εκτίμηση αν υπάρχουν «πολλές» ράβδοι Π.χ. πλήθος κρουσμάτων ανά νόσημα και ηλικία, αριθμός καπνιστών ανά φύλο και ηλικία, πληθυσμός ανά φύλο και περιοχή, κτλ. 58
Σύνολο θανάτων κατά αιτία και ηλικία, Ελλάδα, 2008 Πηγή: ΕΛ.ΣΤΑΤ 59
Ποσοστιαία κατανομή των θανάτων κατά αιτία και ηλικία, Ελλάδα, 2008 Ποσοστιαία κατανομή των θανάτων κατά αιτία και ηλικία, Ελλάδα, 2008 Πηγή: ΕΛ.ΣΤΑΤ 60
ΣΥΣΣΩΡΕΥΤΙΚΟ ΡΑΒΔΟΓΡΑΜΜΑ Χρησιμοποιείται για συχνότητες και ποσοστά Χρησιμοποιείται όπως και το ομαδοποιημένο ραβδόγραμμα Οι στήλες των κατηγοριών στοιβάζονται και δεν τίθενται η μια δίπλα στην άλλη 61
Σύνολο θανάτων κατά αιτία και ηλικία, Ελλάδα, 2008 Πηγή: ΕΛ.ΣΤΑΤ 62
100% ΡΑΒΔΟΓΡΑΜΜΑ ΣΥΝΙΣΤΩΣΩΝ Είναι μια παραλλαγή του συσσωρευτικού ραβδογράμματος Όλες οι στήλες έχουν το ίδιο ύψος (100%) και δείχνουν τις συνιστώσες που αποτελούν κάθε στήλη ως ποσοστό του συνόλου (της στήλης) Χρησιμοποιείται για τη σύγκριση της (ποσοστιαίας) κατανομής των κατηγοριών μιας μεταβλητής σε κάθε στήλη-ομάδα της άλλης μεταβλητής 63
Ποσοστιαία κατανομή των θανάτων κατά αιτία και ηλικία, Ελλάδα, 2008 Πηγή: ΕΛ.ΣΤΑΤ 64
ΡΑΒΔΟΓΡΑΜΜΑ ΑΠΟΚΛΙΣΗΣ Δείχνει την απόκλιση στη μεταβλητή, αρνητική ή θετική Απόκλιση δεξιά δείχνει αύξηση, ενώ αριστερά δείχνει ελάττωση 65
66
ΠΩΣ ΝΑ ΚΑΤΑΣΚΕΥΑΣΕΤΕ ΕΝΑ ΡΑΒΔΟΓΡΑΜΜΑ Όρισε τις κατηγόριες που θα αντιπροσωπευθούν με τις ράβδους σε φυσική τάξη (αλφαβητικά, α/α) Οριζόντια ή κάθετα Μήκος ανάλογο με τη συχνότητα Άφησε διαστήματα Χρωμάτισε 67
ΠΡΟΣΟΧΗ! Το Ιστόγραμμα χρησιμοποιείται για ποσοτικές μεταβλητές και το Ραβδόγραμμα για ποιοτικές μεταβλητές Στο Ιστόγραμμα οι διαδοχικές στήλες είναι ενωμένες Στο Ραβδόγραμμα οι διαδοχικές στήλες δεν είναι ενωμένες 68
ΘΗΚΟΓΡΑΜΜΑ (Box plot) Χρησιμοποιείται για να δείξει τη σχέση μεταξύ μιας ποιοτικής μεταβλητής και μιας ποσοτικής συγκρίνοντας αν υπάρχουν διαφορές μεταξύ των κατηγοριών της ποιοτικής ως προς την ποσοτική Χρησιμοποιείται και για την εύρεση ακραίων τιμών Στον οριζόντιο άξονα (Χ) η ποιοτική μεταβλητή και στον κάθετο (Ψ) η ποσοτική Το ορθογώνιο παραλληλόγραμμο («κουτί») αντιπροσωπεύει το 50% των κεντρικών τιμών των δεδομένων (ενδοτεταρτημοριακό εύρος - IQR) Η γραμμή μέσα στο «κουτί» δείχνει τη διάμεσο Διάμεσος: μέχρι την τιμή της διαμέσου βρίσκεται το 50% των παρατηρήσεων και το υπόλοιπο 50% βρίσκεται πάνω από αυτή Π.χ. ηλικία ανά φύλο, ηλικία πασχόντων και μαρτύρων, τιμή χοληστερόλης ανά τύπο θεραπείας, κτλ. 69
Δείκτης Μάζας Σώματος κατά φύλο, Θεσσαλονίκη, 2009 Δείκτης Μάζας Σώματος κατά φύλο, Θεσσαλονίκη, 2009 Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 70
ΣΗΜΕΙΟΓΡΑΜΜΑ Χρησιμοποιείται όπως και το θηκόγραμμα, απεικονίζει τη σχέση μεταξύ μιας ποιοτικής μεταβλητής (άξονας Χ) και μιας ποσοτικής (άξονας Ψ) Η τιμή κάθε παρατήρησης απεικονίζεται στο γράφημα ως ένα σημείο 71
Δείκτης Μάζας Σώματος κατά φύλο, Θεσσαλονίκη, 2009 Δείκτης Μάζας Σώματος κατά φύλο, Θεσσαλονίκη, 2009 Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 72
ΓΕΩΓΡΑΦΙΚΕΣ ΚΑΤΑΝΟΜΕΣ ΔΕΔΟΜΕΝΩΝ Χρησιμοποιούνται χάρτες ή οριζόντια ραβδογράμματα Υπάρχουν 2 τύποι χαρτών Χάρτης περιοχής (Area map) Χάρτης σημείου (Dot map) Οι χάρτες περιοχής, συνήθως, περιλαμβάνουν σχετικά μεγάλες οριοθετημένες περιοχές (π.χ. νομούς, περιφέρειες, χώρες) και απεικονίζουν με διαφορετικά χρώματα ή σκιαγραφήσεις απόλυτους αριθμούς ορισμένων μεγεθών (π.χ. πληθυσμός, γεννήσεις, αριθμός ασθενών για κάποιο νόσημα) ή δείκτες-ρυθμούς (π.χ. θνησιμότητας, γονιμότητας, νοσηρότητας) Οι χάρτες σημείου, συνήθως, αναφέρονται σε μικρότερες γεωγραφικές περιοχές και απεικονίζουν τη γεωγραφική κατανομή των συμβάντων (περιπτώσεων) με σημεία Παρέχουν πληροφόρηση για τη σχέση μεταξύ των περιοχών Εύκολοι και κατανοητοί 73
ΧΑΡΤΗΣ ΠΕΡΙΟΧΗΣ: Μετρήσεις Αρσενικού στο πόσιμο νερό σε δήμους του Ν ΧΑΡΤΗΣ ΠΕΡΙΟΧΗΣ: Μετρήσεις Αρσενικού στο πόσιμο νερό σε δήμους του Ν. Λάρισας, 2010 Πηγή: Εργαστήριο Υγιεινής & Επιδημιολογίας 74
Πληθυσμός ανά νομό, Ελλάδα, απογραφή 1991 Πηγή: Εργαστήριο Δημογραφικών και Κοινωνικών Αναλύσεων 75
ΧΑΡΤΗΣ ΣΗΜΕΙΟΥ 76
ΟΡΙΖΟΝΤΙΟ ΡΑΒΔΟΓΡΑΜΜΑ Χρησιμοποιείται για την απεικόνιση της γεωγραφικής κατανομής των συχνοτήτων (ή ποσοστών) μιας ποιοτικής μεταβλητής χωρίς όμως να προσφέρει περισσότερη πληροφορία για τη σχέση μεταξύ των περιοχών Οι στήλες εμφανίζονται σε αύξουσα ή φθίνουσα σειρά π.χ. το ποσοστό γήρανσης ανά νομό/χώρα, η γονιμότητα ή η θνησιμότητα ανά περιφέρεια/νομό/χώρα, κτλ. 77
Πληθυσμός ανά νομό, Ελλάδα, απογραφή 2001 78
Επιλέγοντας πίνακες, γραφήματα, παραστάσεις… Γράφημα αριθμητικό Γράφημα ημιλογαριθμικό Ιστόγραμμα Τάσεις αριθμών στο χρόνο Αναλογία μεταβολών στο χρόνο Μεγάλες αποκλίσεις Κατανομή συχνότητας συνεχούς μεταβλητής Επιδημική καμπύλη 79
Επιλέγοντας πίνακες, γραφήματα, παραστάσεις… Πολύγωνο συχνοτήτων Αθροιστική συχνότητα Διάγραμμα διασποράς Συχνότητα συνεχούς μεταβλητής Αθροιστική συχνότητα συνεχούς μεταβλητής Συσχέτιση δύο μεταβλητών 80
Επιλέγοντας γραφήματα, διαγράμματα… Ραβδόγραμμα Ραβδόγραμμα απόκλισης Κυκλικό διάγραμμα (πίτα) Χάρτης σημείων Σύγκριση κατηγοριών ποιοτικής μεταβλητής Διαφορές από την βασική τιμή + ή - Γεωγραφική κατανομή 81
1 ομάδα (νόσημα) ιστόγραμμα ≥ 2 ομάδες πολύγωνο συχνοτήτων Δεδομένα στο χρόνο… Αριθμός κρουσμάτων 1 ομάδα (νόσημα) ιστόγραμμα ≥ 2 ομάδες πολύγωνο συχνοτήτων Ρυθμός (rate) εύρος τιμών μικρό γράφημα αριθμητικό εύρος τιμών μεγάλο γράφημα ημιλογαριθμικό 82
Συνεχή δεδομένα όχι σε συνάρτηση με το χρόνο… Ιστόγραμμα ή πολύγωνο συχνοτήτων 83
Διακριτά δεδομένα όχι σε συνάρτηση με το χώρο… Κυκλικό διάγραμμα ή ραβδόγραμμα 84
(Οριζόντιο) ραβδόγραμμα χάρτης σημείου χάρτης περιοχής Δεδομένα στο χώρο… Αριθμός κρουσμάτων Ασαφώς αναγνωρίσιμα σε χάρτη (Οριζόντιο) ραβδόγραμμα Σαφώς αναγνωρίσιμα σε χάρτη χάρτης σημείου χάρτης περιοχής Ρυθμός χάρτης περιοχής ερφρεγφρεγφωεργφ 85
86