Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας Ποσοτικής μεταβλητής σε σχέση με μία Ποιοτική μεταβλητή (εντολή By variable) π.χ. Να συγκριθούν οι.

Slides:



Advertisements
Παρόμοιες παρουσιάσεις
Εισαγωγή στην Επιστήμη των Η/Υ ΙΙ Μάθημα 6 Παλινδρόμηση – Δημιουργία Video - Συναρτήσεις - GUI
Advertisements

Εξόρυξη Γνώσης Από Χωρικά Δεδομένα Φροντιστήριο Αγγελική Σκούρα
Εξόρυξη Γνώσης Από Χωρικά Δεδομένα
Εισαγωγή στην Κοινωνιογλωσσολογία
Ανάλυση Ποσοτικών Δεδομένων Στατιστική
ΗΥ150 – ΠρογραμματισμόςΚώστας Παναγιωτάκης ΗΥ-150 Προγραμματισμός Πίνακες (Arrays)
ΣΤΑΤΙΣΤΙΚΗ Η επιστήμη που ασχολείται με την συλλογή δεδομένων,ανάλυση και ερμηνεία αυτών Η επιστήμη με τη χρήση της οποίας λαμβάνουμε αποφάσεις κάτω από.
ΜΥΥ105: Εισαγωγή στον Προγραμματισμό Έλεγχος Ροής - Παραδείγματα Χειμερινό Εξάμηνο 2015.
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ #1 ΔΔΕ. Έναρξη (Start)  Προγράμματα (Programs)  Minitab 12 for Windows.
1 ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ ΠΑΡΑΔΟΣΗ 1Οη (Θ) Στοιχεία Επαγωγικής Στατιστικής.
ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΤΕΡΙΝΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΣΥΣΤΗΜΑΤΩΝ ΕΦΟΔΙΑΣΜΟΥ (LOGISTICS) ΕΠΙΒΛΕΠΟΥΣΑ ΚΑΘΗΓΗΤΡΙΑ: ΣΤΑΦΥΛΑ ΑΜΑΛΙΑ ΤΡΥΦΩΝΟΠΟΥΛΟΥ ΙΩΑΝΝΑ.
Χαρακτηριστικά μιας Κατανομής. συμμετρικές και μη συμμετρικές κατανομές.
ΠΕΡΙΓΡΑΦΙΚΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ – Ποσοτικές μεταβλητές
Τι είναι η Κατανομή (Distribution)
Στατιστική ανάλυση των πειραματικών μετρήσεων
Μέτρα Διασποράς Η μεταβλητότητα, ή αλλιώς η ποικιλομορφία, στις τιμές μιας μεταβλητής θα πρέπει πάντοτε να λαμβάνεται υπόψη σε οποιαδήποτε στατιστική ανάλυση!
Διαστήματα Εμπιστοσύνης α) για τη μέση τιμή β) για ένα ποσοστό
ΠΟΣΟΤΙΚΑ ΔΕΔΟΜΕΝΑ.
Μέτρα μεταβλητότητας ή διασποράς
Στατιστικές Υποθέσεις
Διαχείριση και ανάλυση δεδομένων
Χαρακτηριστικά μιας Κατανομής
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Εκτιμητική: σημειακές εκτιμήσεις παραμέτρων
Βελτιστοποίηση σε τρίλιζα Καταδίωξη/διαφυγή
Ανάπτυξη Μοντέλων Διακριτών Συστημάτων Μέρος Α
ΣΤΑΤΙΣΤΙΚΗ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
Εισαγωγή στο SPSS.
Βασική Στατιστική Επεξεργασία. Ερμηνεία Δεδομένων - 2.
DREMEL: Interactive Analysis of Web-Scale Datasets
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 3 ΔΔΕ
Στατιστικές Υποθέσεις III
Μέτρα κεντρικής τάσης και διασποράς
ΘΕΡΜΟΤΗΤΑ - ΘΕΡΜΟΚΡΑΣΙΑ
Έλεγχος ανεξαρτησίας (συσχέτισης) 2 κατηγορικών μεταβλητών
Η ‘ΟΜΟΡΦΗ ΠΑΦΟΣ ΚΑΤΕΡΙΝΑ ΠΑΝΑΓΙΩΤΟΥ Δ΄1 ΝΕΦΕΛΗ ΒΑΣΙΛΕΙΟΥ Δ΄1.
Συλλογή, επεξεργασία και παρουσίαση δεδομένων
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΙΣΑΓΩΓΗ - ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ
Χαρακτηριστικά μιας Κατανομής
Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική
Μέτρα μεταβλητότητας ή διασποράς
ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧ/ΣΕΩΝ ΕΡΓΑΣΤΗΡΙΟ 2 ΔΔΕ.
Οικιακή Οικονομία Α’ Γυμνασίου Μάθημα 6ο. Διδάσκων καθηγητής
Μέγεθος επιχείρησης και αμοιβές στην ελληνική αγορά εργασίας: Ενδείξεις απο ενοποιημένα στοιχεία εργαζόμενων και εργοδοτών Γιαννακόπουλος Νικόλαος (PhD)
Ερωτήματα Επιλογής Δεδομένων
Solutions All-in-one 112 Ω Word NEAT Box Dig Dig
Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT
ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Βιοστατιστική (Θ) Ενότητα 7: Μη-Παραμετρικές Δοκιμασίες
مديرة المدرسة أ. خالدة المير رئيسة القسم أ. منيرة العدواني
מדדי מרכזיות שכיח Mo – (Mode) חציון (Median) Md –
الإحصاء الحيوي Biostatistics
Στατιστικές Υποθέσεις
Τ. Ε. Ι. Αθήνας Τμήμα Ιατρικών Εργαστηρίων ΒΙΟΣΤΑΤΙΣΤΙΚΗ
Financial Market Theory
Solutions All-in-one 112 Ω Word NEAT Box Dig Dig
Deriving the equations of
Κεφάλαιο 12 Απλή Γραμμική Παλινδρόμηση.
ΣΤΑΣΕΙΣ ΚΑΙ ΣΥΜΠΕΡΙΦΟΡΑ
Κεφάλαιο 3 Αριθμητικά Περιγραφικά Μέτρα.
Βιοστατιστική (Θ) Ενότητα 5: Μη-Παραμετρικές Δοκιμασίες ΤΕΙ Αθήνας
Accumulation of Cpd-1 and Cpd-2 depends on LamB expression.
Αρχές Bιοστατιστικής Γεωργία Βουρλή Τμήμα Βιοστατιστικής και Επιδημιολογίας Ιατρική Σχολή ΕΚΠΑ Μεταπτυχιακό Πρόγραμμα Αγγειοχειρουργική.
Boxplots of report counts per patient.
Raman profiles of the stratum corneum define 3 filaggrin genotype–determined atopic dermatitis endophenotypes  Gráinne M. O'Regan, MRCPI, Patrick M.J.H.
Δρ Μαρία Καμηλάκη, Διδάσκουσα Π.Δ. 407/80 Φιλοσοφική Σχολή
Induction of a range of IFN-induced cytokines at 0.1 mg/kg urelumab.
Distribution of responses to LPS of B
Μεταγράφημα παρουσίασης:

Περιγραφικά μέτρα κεντρικής τάσης και διασποράς μιας Ποσοτικής μεταβλητής σε σχέση με μία Ποιοτική μεταβλητή (εντολή By variable) π.χ. Να συγκριθούν οι καπνιστές και οι μη καπνιστές(Ποιοτική μεταβλητή Smokes) ως προς τον σφυγμό τους (Ποσοτική μεταβλητή Pulse 2) α) με βάση τα περιγραφικά μέτρα και β) με γραφικές παραστάσεις – Να εξεταστεί η ύπαρξη ακραίων τιμών (box-plot και Steam-and-leaf) α)Stat  Basic statistics  Display Descriptive Statistics  Επιλέγω ποσοτική μεταβλητή: Pulse 2 (Variables)  και στο ίδιο παράθυρο διαλόγου επιλέγω : By variable  ποιοτική μεταβλητή: Smokes Graphs  Graphical Summary  2 φορές οκ

Στο παράθυρο Session εμφανίζονται τα παρακάτω: Descriptive Statistics Variable Smokes N Mean Median TrMean StDev Pulse ,18 77,00 80,92 15, ,48 76,00 78,22 17,88 Variable Smokes SE Mean Minimum Maximum Q1 Q3 Pulse2 1 2,91 54,00 115,00 70,50 93,50 2 2,23 50,00 140,00 68,00 84,00 Όπου 1= καπνιστής 2= μη καπνιστής

Α) Μέτρα θέσης ή Κεντρικής τάσης : 1) Καπνιστές(Group1) 1)Ο μέσος αριθμητικός ή μέση τιμή (Mean Value, ) = 81,18 2)Διάμεσος (Μ,Median) = 77 3)Τεταρτημόρια (Quartiles) : α) 1ο τεταρτημόριο  Q1 = 70,50 β) 2ο τεταρτημόριο (Διάμεσος Μ)  Q2 = 77 γ) 3ο τεταρτημόριο  Q3 = 93,50 4)Επικρατούσα τιμή ( Μο, Μode)  Μο = 3 * Μ – 2 * Χ = = 3*77-2*81,18 = 68,64 Β) Μέτρα Διασποράς ή Μεταβλητότητας : 1) Καπνιστές 1)Εύρος μεταβολής ή εύρος (Range) : R = Xmax – Xmin = =61 2)Ενδοτεταρτημοριακό Εύρος (Interquartile Range, Q) : Q = Q3 – Q1 = 93,50 – 70,50 = 23

3) Διακύμανση (variance, s 2 ) = 236,967 4) Τυπική απόκλιση (Standard deviation, s)  StDev = 15,39 ή επειδή η τυπική απόκλιση ορίζεται ως η τετραγωνική ρίζα της διακύμανσης δηλ. μπορούμε και να την υπολογίσουμε από το μενού Calk  Calculator και στο Expression: επιλέγω συνάρτηση square root  SQRT(number)  SQRT(236,967)  s = StDev = 15,39 5) Ο συντελεστής μεταβλητότητας (coefficient of variation, CV) * 100 = 15,39 / 81,18 * 100 = 18,96 ≈ 19 % > 10% Άρα το δείγμα είναι ανομοιογενές

Γ) Μέτρα Ασυμμετρίας: 1) Καπνιστές 1ος τρόπος έλεγχος ασυμμετρίας : Mo < M <  ή Mode < Median < Mean  68,64 < 77 < 81,18  Θετική ασυμμετρία Xmin Xmax Mo < M < 2ος τρόπος έλεγχος ασυμμετρίας : Skewness = 0, >0  Θετική ασυμμετρία  το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής

Α) Μέτρα θέσης ή Κεντρικής τάσης : 2) Μη Καπνιστές(Group2) 1)Ο μέσος αριθμητικός ή μέση τιμή (Mean Value, ) = 79,48 2)Διάμεσος (Μ,Median) = 76 3)Τεταρτημόρια (Quartiles) : α) 1ο τεταρτημόριο  Q1 = 68 β) 2ο τεταρτημόριο (Διάμεσος Μ)  Q2 = 76 γ) 3ο τεταρτημόριο  Q3 = 84 4)Επικρατούσα τιμή ( Μο, Μode)  Μο = 3 * Μ – 2 * Χ = = 3 * 76 – 2 * 79,48 = 69,04 Β) Μέτρα Διασποράς ή Μεταβλητότητας : 2) Μη Καπνιστές 1)Εύρος μεταβολής ή εύρος (Range) : R = Xmax – Xmin = =90 2)Ενδοτεταρτημοριακό Εύρος (Interquartile Range, Q) : Q = Q3 – Q1 = 84 – 68 = 16

3) Διακύμανση (variance, s 2 ) = 319,619 4) Τυπική απόκλιση (Standard deviation, s)  StDev = 17,88 ή επειδή η τυπική απόκλιση ορίζεται ως η τετραγωνική ρίζα της διακύμανσης δηλ. μπορούμε και να την υπολογίσουμε από το μενού Calk  Calculator και στο Expression: επιλέγω συνάρτηση square root  SQRT(number)  SQRT(319,619)  s = StDev = 17,88 5) Ο συντελεστής μεταβλητότητας (coefficient of variation, CV) * 100 = 17,88 / 79,48 * 100 = 22,50 ≈ 22 % > 10% Άρα το δείγμα είναι ανομοιογενές

Γ) Μέτρα Ασυμμετρίας: 2) Μη Καπνιστές 1ος τρόπος έλεγχος ασυμμετρίας : Mo < M <  ή Mode < Median < Mean  69,04 < 76 < 79,48  Θετική ασυμμετρία Xmin Xmax Mo < M < 2ος τρόπος έλεγχος ασυμμετρίας : Skewness = 1,36980 >0  Θετική ασυμμετρία  το πλήθος των παρατηρήσεων βρίσκεται δεξιά της κορυφής

Δ)ΕΦΑΡΜΟΓΗ ΕΜΠΕΙΡΙΚΟΥ ΚΑΝΟΝΑ: Καπνιστές 1)(X – S, X + S ) ≈ 68 %  (81, ,39, 81, ,39) = (65,79, 96,57) ΆΡΑ οι σφυγμοί για το 68% των καπνιστών κυμαίνονται από 65,79 έως 95,57 2) (X – 2S, X + 2S ) ≈ 95 %  (81,18 - 2* 15,39, 81,18 + 2* 15,39) = (50,40, 111,96) ΆΡΑ οι σφυγμοί για το 95% των καπνιστών κυμαίνονται από 50,40 έως 111,96 3) (X – 3S, X + 3S ) ≈ 99 %  (81,18 - 3* 15,39, 81,18 + 3* 15,39) (35,01, 127,35) ΆΡΑ οι σφυγμοί για το 99% των καπνιστών κυμαίνονται από 35,01 έως 127,35

Δ)ΕΦΑΡΜΟΓΗ ΕΜΠΕΙΡΙΚΟΥ ΚΑΝΟΝΑ: Μη Καπνιστές 1)(X – S, X + S ) ≈ 68 %  (79, ,88, 79, ,88) = (61,60, 97,36) ΆΡΑ οι σφυγμοί για το 68% των μη καπνιστών κυμαίνονται από 61,60 έως 97,36 2) (X – 2S, X + 2S ) ≈ 95 %  (79,48 - 2* 17,88, 79,48 + 2* 17,88) = (43,72, 115,24) ΆΡΑ οι σφυγμοί για το 95% των μη καπνιστών κυμαίνονται από 43,72 έως 115,24 3) (X – 3S, X + 3S ) ≈ 99 %  (79,48 - 3* 17,88, 79,48 + 3* 17,88) (25,84, 133,12) ΆΡΑ οι σφυγμοί για το 99% των μη καπνιστών κυμαίνονται από 25,84 έως 133,12

β) Θηκόγραμμα : Box plot (Ανίχνευση ακραίων τιμών) Graphs  Boxplot  Επιλέγω ποσοτική μεταβλητή: Pulse 2 στο Y (measurement) και ποιοτική μεταβλητή: Smokes στο Χ (category) Annotation: επιλέγω Outlier labels… και επιλέγω Show Outlier labels  και μία φορά οκ

Ομοίως Median Labels, Mean Labels

Διάγραμμα μίσχου-φύλλου (Steam and Leaf) Μενού Graphs  Steam and Leaf Επιλέγω ποσοτική μεταβλητή: Pulse 2 (Variables)  και στο ίδιο παράθυρο διαλόγου επιλέγω : By variable  ποιοτική μεταβλητή: Smokes  ΟΚ

Stem-and-leaf of Pulse2 Smokes = 1 N = 28 Leaf Unit = 1, (9)

Stem-and-leaf of Pulse2 Smokes = 2 N =64 Leaf Unit = 1, (21)

Κοινή Κατανομή Δύο Ποιοτικών Μεταβλητών. Πίνακες Συνάφειας: Ταξινομούνται τα δεδομένα σε πίνακα ως προς δύο ποιοτικές μεταβλητές καθώς και η μέση τιμή, διάμεσος, τυπική απόκλιση κλπ. μιας ποσοτικής μεταβλητής για κάθε κατηγορία των ποιοτικών μεταβλητών. Δηλ. εξετάζουμε την συνάφεια μεταξύ μιας ΠΟΣΟΤΙΚΗΣ μεταβλητής με δύο ΠΟΙΟΤΙΚΕΣ μεταβλητές. 1)STAT  TABLES  CROSS TABULATION  CLASSIFICATION VARIABLES : 2 ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ  ( Smokes Activity) DISPLAY: ΕΠΙΛΕΓΩ COUNTS, ROW PERCENTS, COLUMN PERCENTS, TOTAL PERCENTS και οκ

Rows: Smokes Columns: Activity ΚΑΘΟΛΟΥ 0 ΜΙΚΡΗ 1 ΜΕΤΡΙΑ 2 ΕΝΤΟΝΗ 3 All ΚΑΠΝΙΣΤΕΣ 1 1 3,57 100,00 1, ,71 33,33 3, ,86 31,15 20, ,86 23,81 5, ,00 30,43 ΜΗ ΚΑΠΝΙΣΤΕΣ ,37 66,67 6, ,62 68,85 45, ,00 76,19 17, ,00 69,57 All 1 1,09 100,00 1,09 9 9,78 100,00 9, ,30 100,00 66, ,83 100,00 22, ,00 Cell Contents Count  Συχνότητες % of Row  Ποσοστά γραμμών % of Col  Ποσοστά στηλών % of Tbl  Ποσοστά Ολικά

2)STAT  TABLES  CROSS TABULATION  CLASSIFICATION VARIABLES : 2 ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ SUMMARIES  ASSOCIATED VARIABLES : 1 ΠΟΣΟΤΙΚΗ ΜΕΤΑΒΛΗΤΗ  ΚΑΙ 2 ΦΟΡΕΣ ΟΚ ΠΡΟΣΟΧΗ: ΔΕΝ ΕΠΙΛΕΓΩ COUNTS, ROW PERCENTS, COLUMN PERCENTS, TOTAL PERCENTS

Rows: Smokes Columns: Activity ΚΑΘΟΛΟΥ 0 ΜΙΚΡΗ 1 ΜΕΤΡΙΑ 2 ΕΝΤΟΝΗ 3 All ΚΑΠΝΙΣΤΕΣ 1 150,00158,33152,26149,20152,29 ΜΗ ΚΑΠΝΙΣΤΕΣ ,50139,90146,69142,03 All 150,00149,11143,75147,29145,15 Cell Contents Weight: Mean

Ραβδόγραμμα (Chart): με δύο ποιοτικές μεταβλητές Graph  Chart  Μεταβλητή Activity (ποιοτική)  1) Data display, όπου for each βάζω Group και Group variables: Smokes 2) Options a) cluster (οι ράβδοι και των 2 μεταβλ.  η μία δίπλα στην άλλη β) stack (οι ράβδοι και των 2 μεταβλ.  η μία πάνω στην άλλη

α) cluster

β) stack