Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παράδειγμα n=60 οικογένεις, X=αριθμός παιδιών 2 3 1 4 5
Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Αριθμός παιδιών συχνότητα Σχετική συχνότητα (%) 8 13,33% 1 18 30,00% 2 22 36,67% 3 7 11,67% 4 6,67% 5 1,67% Σύνολο 60 100,00%
Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Αριθμός παιδιών συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 8 13,33% 1 18 30,00% 26 43,33% 2 22 36,67% 48 80,00% 3 7 11,67% 55 91,67% 4 6,67% 59 98,33% 5 1,67% 60 100,00% Σύνολο
Συχνότητα – Αθροιστική Συχνότητα Αριθμός παιδιών συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 8 13,33% 1 18 30,00% 26 43,33% 2 22 36,67% 48 80,00% ... .... ..... Το 22 σημαίνει πως έχουμε 22 οικογένειες με ακριβώς 2 παιδιά Το 48 σημαίνει πως έχουμε 48 οικογένειες που έχουν 2 ή λιγότερα παιδιά (δηλ. 0, 1 ή 2 παιδιά)
Κατανομές (διακριτές) 1 x x 1 2 3 4 5 1 2 3 4 5 συχνότητες Αθροιστικές συχν. f(x), πυκνότητα πιθανότητας Probability density F(x), συνάρτηση κατανομής Distribution function
Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παράδειγμα n=55, X= το βάρος κάποιων προϊόντων (gr) 368 373 374 377 378 379 380 382 383 384 387 388 389 391 392 393 394 395 396 398 399 400 401 402 403 404 405 409 412 413 414 416 417 418 419 421 422 423 424 426 428 429 430 431 435 438
Ομαδοποίηση των δεδομένων α) Βρίσκουμε τη μικρότερη και τη μεγαλύτερη τιμή, για να βρούμε το εύρος των δεδομένων R = μεγαλύτερη - μικρότερη (π.χ. R=438 - 368 = 70) Έχουμε δηλαδή R μονάδες να καλύψουμε με κάποιες κλάσεις
Ομαδοποίηση των δεδομένων β) αποφασίζουμε για τον αριθμό των κλάσεων (k). Ένας τύπος που δουλεύει σε πολλές περιπτώσεις είναι ο για n=50, χρησιμοποιούμε 6-7 κλάσεις για n=100, χρησιμοποιούμε 7-8 κλάσεις για n=500, χρησιμοποιούμε 9-10 κλάσεις (π.χ. στο παράδειγμα χρησιμοποιούμε 8 κλάσεις)
Ομαδοποίηση των δεδομένων γ) υπολογίζουμε το πλάτος της κάθε κλάσης (d) d>70/8 = 8,75 στρογγυλοποιούμε στο 9 ή στο 10 Προσοχή: στρογγυλοποιούμε πάντα προς τα πάνω!!!
Ομαδοποίηση των δεδομένων δ) τέλος γράφουμε τις κλάσεις (ομάδες). Συνήθως έχουμε πολλές επιλογές από ποιο σημείο να αρχίσουμε και σε ποιο να τελειώσουμε π.χ. 365-375, 375-385, 385-395, 395-405, 405-415, 415-425, 425-435, 435-445 ή 363-373, 373-383, 383-393, 393-403, 403-413, 413-423, 423-433, 433-443
ή ακόμη 360-370, 370-380, 380-390, 390-400, 400-410, 410-420, 420-430, 430-440 Στη συνέχεια μετράμε πόσες περιπτώσεις ανήκουν σε κάθε κλάση. Όταν βρούμε μια τιμή στο ανώτερο άκρο της κλάσης (π.χ. 390), την τοποθετούμε στην επόμενη κλάση.
Π.χ. στην πρώτη κλάση 360-370 έχουμε 2 παρατηρήσεις 368 373 374 377 378 379 380 382 383 384 387 388 389 391 392 393 394 395 396 398 399 400 401 402 403 404 405 409 412 413 414 416 417 418 419 421 422 423 424 426 428 429 430 431 435 438 έχουμε 2 παρατηρήσεις
Ενώ στην δεύτερη 370-380 έχουμε 6 παρατηρήσεις 368 373 374 377 378 379 382 383 384 387 388 389 391 392 393 394 395 396 398 399 400 401 402 403 404 405 409 412 413 414 416 417 418 419 421 422 423 424 426 428 429 430 431 435 438 έχουμε 6 παρατηρήσεις
Οπότε έχουμε τελικά συχνότητα Βάρος 360-370 2 370-380 6 380-390 7 390-400 12 400-410 410-420 9 420-430 8 430-440 4 Σύνολο 55
Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Βάρος συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 360-370 2 3,64% 370-380 6 10,91% 8 14,55% 380-390 7 12,73% 15 27,27% 390-400 12 21,82% 27 49,09% 400-410 34 61,82% 410-420 9 16,36% 43 78,18% 420-430 51 92,73% 430-440 4 7,27% 55 100,00% Σύνολο
Συχνότητα – Αθροιστική Συχνότητα Βάρος συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 360-370 2 3,64% 370-380 6 10,91% 8 14,55% 380-390 7 12,73% 15 27,27% 390-400 12 21,82% 27 49,09% ….. …… Το 7 σημαίνει πως έχουμε 7 προϊόντα με βάρος ανάμεσα στα 380 και τα 390 γραμ. Το 15 σημαίνει πως έχουμε 15 προϊόντα με βάρος λιγότερο από 390 γραμ.
Ιστόγραμμα & Πολύγωνο Συχνοτήτων
Ιστόγραμμα & Πολύγωνο Αθροιστικών Συχνοτήτων
Κατανομές (συνεχείς) συχνότητες Αθροιστικές συχν. 1 συχνότητες Αθροιστικές συχν. f(x), πυκνότητα πιθανότητας F(x), συνάρτηση κατανομής
ΣΥΝΕΧΕΙΣ ΜΕΤΑΒΛΗΤΕΣ? Τις χρειαζόμαστε πραγματικά?? Σε κοινωνικές επιστήμες και στην ψυχολογία-ψυχιατρική χρησιμοποιούνται κλίμακες - ερωτηματολόγια (τεστ) με διάφορες ερωτήσεις, οι οποίες με κάποιους απλούς υπολογισμούς, δίνουν κάποιο τελικό σκορ (score) σε κάθε εξεταζόμενο (π.χ. αλκοολισμός, μανία, διάσπαση προσοχής, ενδοοικογενειακή βία, κακοποίηση, εξάρτηση από διαδίκτυο κλπ)
Π.χ. για την κατάθλιψη, υπάρχει ένα τεστ με 18 ερωτήσεις ποιοτικές διατάξιμες (ποτέ, σπάνια, περιστασιακά, σχετικά συχνά, συχνά, πολύ συχνά) Δίνοντας στις απαντήσεις τους αριθμούς 0 1 2 3 4 5 Το συνολικό σκορ κατάθλιψης βγαίνει με ένα απλό ΑΘΡΟΙΣΜΑ των απαντήσεων, οπότε Min=0, Max=5*18=90 και αποτελεί μια συνεχή μεταβλητή Όσο πιο μεγάλο σκορ τόσο πιο κοντά στην κατάθλιψη είναι κάποιος