Δρ. Γιώργος Μαρκάκης Καθηγητής Βιομετρίας Τ.Ε.Ι. Κρήτης ΒΙΟΜΑΘΗΜΑΤΙΚΑ Δρ. Γιώργος Μαρκάκης Καθηγητής Βιομετρίας Τ.Ε.Ι. Κρήτης
Βιο - Μαθηματικά Μαθηματικά Ντετερμινιστικά (καθορισμένα, αιτιοκρατικά) Πιθανότητες / Στατιστική (στοχαστικά) Οι Φυσικές Επιστήμες χρησιμοποιούν και τους δύο μεγάλους κλάδους
(και Θεωρία Πιθανοτήτων) ΣΤΑΤΙΣΤΙΚΗ (και Θεωρία Πιθανοτήτων)
Πληθυσμός & Δείγμα n = μέγεθος δείγματος
Στατιστική Παρουσίαση των στοιχείων του δείγματος Συμπεράσματα για ολόκληρο τον πληθυσμό Περιγραφική Στατιστική Επαγωγική Στατιστική
Μεταβλητές X, Y, … (μετρήσεις, χαρακτηριστικά) Ποσοτικά (αριθμητικά) Ποιοτικά (κατηγορικά) Διακριτά Συνεχή Δείγμα = X1, X2, …, Xn
Μετρήσεις στη Γεωπονία Βάρος, μήκος ενός φυτού, αριθμός φύλλων, χρώμα, ωριμότητα, περιεκτικότητα σε σάκχαρα,… Παραγωγή ενός πειραμτικού τεμαχίου (plot) χωράφι plots
Παρουσίαση Κατηγορικών Χαρακτηριστικών Παράδειγμα n=40, X=ομάδα αίματος Ο Α Β ΑΒ
Παρουσίαση Κατηγορικών Χαρακτηριστικών κατηγορίες Συχνότητα Σχετική Συχνότητα (%) A 18 45,0% B 4 10,0% AB 3 7,5% O 15 37,5% Σύνολο 40 100% Ραβδόγραμμα (Bar) Πίνακας Συχνοτήτων Πίτα (Pie)
Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παράδειγμα n=60 οικογένεις, X=αριθμός παιδιών 2 3 1 4 5
Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Παρουσίαση Αριθμητικών Χαρακτηριστικών 1) Διακριτών Αριθμός παιδιών συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 8 13,33% 1 18 30,00% 26 43,33% 2 22 36,67% 48 80,00% 3 7 11,67% 55 91,67% 4 6,67% 59 98,33% 5 1,67% 60 100,00% Σύνολο
Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παράδειγμα n=55, X= το βάρος κάποιων προϊόντων (gr) 368 373 374 377 378 379 380 382 383 384 387 388 389 391 392 393 394 395 396 398 399 400 401 402 403 404 405 409 412 413 414 416 417 418 419 421 422 423 424 426 428 429 430 431 435 438
Ομαδοποίηση των δεδομένων α) Βρίσκουμε τη μικρότερη και τη μεγαλύτερη τιμή, για να βρούμε το εύρος των δεδομένων R = μεγαλύτερη - μικρότερη (π.χ. R=438 - 368 = 70) Έχουμε δηλαδή R μονάδες να καλύψουμε με κάποιες κλάσεις
Ομαδοποίηση των δεδομένων β) αποφασίζουμε για τον αριθμό των κλάσεων (k). Ένας τύπος που δουλεύει σε πολλές περιπτώσεις είναι ο για n=50, χρησιμοποιούμε 6-7 κλάσεις για n=100, χρησιμοποιούμε 7-8 κλάσεις για n=500, χρησιμοποιούμε 9-10 κλάσεις (π.χ. στο παράδειγμα χρησιμοποιούμε 8 κλάσεις)
Ομαδοποίηση των δεδομένων γ) υπολογίζουμε το πλάτος της κάθε κλάσης (d) d> 70/8 = 8,75 στρογγυλοποιούμε στο 9 ή στο 10 Προσοχή: στρογγυλοποιούμε πάντα προς τα πάνω!!!
Ομαδοποίηση των δεδομένων δ) τέλος γράφουμε τις κλάσεις (ομάδες). Συνήθως έχουμε πολλές επιλογές από ποιο σημείο να αρχίσουμε και σε ποιο να τελειώσουμε π.χ. 365-375, 375-385, 385-395, 395-405, 405-415, 415-425, 425-435, 435-445 ή 363-373, 373-383, 383-393, 393-403, 403-413, 413-423, 423-433, 433-443
ή ακόμη 360-370, 370-380, 380-390, 390-400, 400-410, 410-420, 420-430, 430-440 Στη συνέχεια μετράμε πόσες περιπτώσεις ανήκουν σε κάθε κλάση. Όταν βρούμε μια τιμή στο ανώτερο άκρο της κλάσης (π.χ. 390), την τοποθετούμε στην επόμενη κλάση.
Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Παρουσίαση Αριθμητικών Χαρακτηριστικών 2) Συνεχών Βάρος συχνότητα Σχετική συχνότητα (%) Αθροιστική συχνότητα Αθροιστική 360-370 2 3,64% 370-380 6 10,91% 8 14,55% 380-390 7 12,73% 15 27,27% 390-400 12 21,82% 27 49,09% 400-410 34 61,82% 410-420 9 16,36% 43 78,18% 420-430 51 92,73% 430-440 4 7,27% 55 100,00% Σύνολο
Ιστόγραμμα & Πολύγωνο Συχνοτήτων
Ιστόγραμμα & Πολύγωνο Αθροιστικών Συχνοτήτων
Κατανομές (συνεχείς) συχνότητες Αθροιστικές συχν. 1 συχνότητες Αθροιστικές συχν. f(x), πυκνότητα πιθανότητας F(x), συνάρτηση κατανομής
Η σημασία των f(x) και F(X) (σε συνεχείς κατανομές) 1 P[X≤a] P[X≤a] a a Το ποσοστό (πιθανότητα) είναι το εμβαδόν κάτω από την f(x) ή απλά ένα σημείο στην F(x)
Στατιστικοί Πίνακες Κατανομών x F(x) …. ….. 53 0.458 Όλες οι δυνατές τιμές της X P[X≤53] = 0.458 ή 45.8%
Χρησιμότητα των Πινάκων a) Βρίσκουμε ποσοστά της μορφής P[X≤a] b) Βρίσκουμε ποσοστά της μορφής P[X>a] P[X>a] = 1-P[X≤a] c) Βρίσκουμε ποσοστά της μορφής P[a<X≤b] P[a<X≤b] = P[X≤b]-P[X≤a]