ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 3 ΙΕΚ Γαλατσίου Στατιστική Ι Μάθημα 3 Βαγγέλης Ντάλλας
Αθροιστικές συχνότητες Πολλές φορές μας ενδιαφέρει να μάθουμε το πλήθος ή το ποσοστό των παρατηρήσεων, που οι τιμές τους είναι μικρότερες ή ίσες ορισμένης τιμής xi της ποσοτικής μεταβλητής Χ.
Αθροιστική Συχνότητα Ni Σε ποσοτική μεταβλητή αθροιστική συχνότητα μιας τιμής xi λέγεται το άθροισμα των συχνοτήτων vi των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή. Η Αθροιστική Σχετική Συχνότητα Fi Σε ποσοτική μεταβλητή σχετική αθροιστική συχνότητα μιας τιμής xi λέγεται το άθροισμα των σχετικών συχνοτήτων fi των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή. Σε ποσοτική μεταβλητή σχετική αθροιστική συχνότητα% μιας τιμής xi λέγεται το άθροισμα των σχετικών συχνοτήτων i f % των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή. Οι Αθροιστικές συχνότητες Ni και οι αθροιστικές σχετικές συχνότητες Fi έχουν νόημα μόνο σε ποσοτικές μεταβλητές
Η επί τοις εκατό σχετική συχνότητα (ή%) π.χ αν θέλαμε να απαντήσουμε στο ερώτημα «πόσοι οδοντίατροι του παρακάτω παραδείγματος πήραν πτυχίο το πολύ σε 7 χρόνια », θα υπολογίζαμε σύμφωνα με τον πίνακα τη λεγόμενη αθροιστική συχνότητα : Διάρκεια σπουδών (x1) Συχνότητα (ν1) Σχετική συχνότητα (f1) Η επί τοις εκατό σχετική συχνότητα (ή%) 5 6 0,20 20 16 0,53 53 7 3 0,10 10 8 0,17 17 Σύνολο 30 1,00 100 Ν3 = v1 + ν2+ ν3 = 6 + 16 + 3 = 25. Οι 25, λοιπόν, οδοντίατροι πήραν πτυχίο το πολύ σε 7 χρόνια, ή σε όρους σχετικής αθροιστικής συχνότητας F3 % = f1 % + f2 % + f3 % = 20 + 53 + 10 = 83% των οδοντιάτρων.
Γενικεύοντας, ορίζουμε την: Αθροιστική συχνότητα και την Σχετική αθροιστική συχνότητα με τις τιμές x1,x2 ,x3 ,....xk της ποσοτικής μεταβλητής Χ διατεταγμένες σε αύξουσα τάξη. Η επί τοις εκατό σχετική αθροιστική συχνότητα ισούται με Fi% = 100 Fi
Αθροιστική συχνότητα (Ν1) Σχετική αθροιστική συχνότητα (F1) N1=ν1=6 F1=f1=0,20 N2=v1+ν2=22 F2=f1+f2=0,73 N3=ν1+ν2+ν3=25 F3=f1+f2+f3=0,83 Ν=N4=ν1+ν2+ν3+ν4=30 F=F4=f1+f2+f3+f4=1,00
Άσκηση 1 Ρωτήσαμε 200 μαθητές πόσα βιβλία διάβασαν το περασμένο καλοκαίρι. Τα αποτελέσματα φαίνονται στον παρακάτω πινάκα. Αριθ. βιβλίων xi Συχνότητα v i 90 1 60 2 26 3 16 4 8 Σύνολο 200 Να κατασκευάσετε πινάκα κατανομής v i , i f , f i %, Ni , Fi , Fi % Πόσοι μαθητές διάβασαν το πολύ 2 βιβλία Το ποσοστό των μαθητών που διάβασε το πολύ 1 βιβλίο Πόσοι μαθητές διάβασαν τουλάχιστον 2 βιβλία Το ποσοστό των μαθητών που διάβασε τουλάχιστον 3 βιβλία Το ποσοστό των μαθητών που διάβασε τουλάχιστον 1 αλλά το πολύ 3 βιβλία
Αριθμό. βιβλίων xi Συχνότητα vi Σχετ.συχν. fi fi % Αθρ.συχν. N i Αθρ.σχετ. συχν. Fi Αθρ.σχετ. συχν. Fi % 90 0,45 45 1 60 0,30 30 150 0,75 75 2 26 0,13 13 176 0,88 88 3 16 0,08 8 192 0,96 96 4 0,04 200 1,00 100 Σύνολο Το πλήθος των μαθητών που διάβασαν το πολύ 2 βιβλία (δηλ. 0 ή 1 ή 2) είναι : v1 + v 2 + v 3 =N3 =176 Το ποσοστό των μαθητών που διάβασε το πολύ 1 βιβλίο (δηλ. 0 ή 1) είναι :f1 % + f2 % = F2 %=75% Το πλήθος των μαθητών που διάβασαν τουλάχιστον 2 βιβλία (δηλ. 2 ή 3 ή 4) είναι : v 3 + v 4 + v 5 = 26 +16 + 8 = 50 Το ποσοστό των μαθητών που διάβασε τουλάχιστον 3 βιβλία (δηλ. 3 ή 4) είναι :f4 % + f5 % - 8% + 4% - 12% Το ποσοστό των μαθητών που διάβασε τουλάχιστον 1 αλλά το πολύ 3 βιβλία (δηλ. 1 ή 2 ή 3) είναι : f2 % + f3 % + f4 % =30% +13% + 8% =51%
Άσκηση 2 Να συμπληρώσετε τον παρακάτω πινάκα xi vi fi N i fi % Fi % 1 0,1 8 3 4 Σύνολο 100
Άσκηση 2 Λύση xi vi fi N i fi % Fi % 1 2 0,1 10 6 0,3 8 30 40 3 0,4 16 80 4 0,2 20 100 Σύνολο
Ομαδοποίηση των Παρατηρήσεων Στην περίπτωση διακριτής μεταβλητής, όταν το πλήθος των τιμών της είναι μεγάλο, αλλά πολύ περισσότερο σε συνεχή μεταβλητή Χ που μπορεί να πάρει οποιαδήποτε τιμή στο διάστημα ορισμού της, ταξινομούμε τα δεδομένα σε μικρό πλήθος ομάδων που ονομάζονται κλάσεις ή τάξεις έτσι, ώστε κάθε τιμή να ανήκει μόνο σε μία κλάση. Ομαδοποιούμε τις παρατηρήσεις χωρίζοντας το διάστημα ορισμού (α0 , ακ) της μεταβλητής Χ σε κλάσεις, δηλαδή σε υποδιαστήματα . Τα άκρα των κλάσεων ονομάζονται όρια των κλάσεων και η διαφορά :
Στην πράξη συνήθως χρησιμοποιούμε κλάσεις ίσου πλάτους, εκτός βέβαια από τις περιπτώσεις εκείνες που η χρήση κλάσεων άνισου πλάτους κρίνεται απαραίτητη. Αν συμβολίσουμε με R το εύρος του συνολικού δείγματος όπου υπολογίζουμε το πλάτος c των κλάσεων διαιρώντας το εύρος R δια του αριθμού των κλάσεων, δηλαδή c= R /κ , όπου κ είναι το πλήθος των κλάσεων Πχ αν θέλουμε να κάνουμε ομαδοποίηση για πλήθος 50 σε 5 κλάσεις έχουμε c= 50/5=10 Δηλαδή 1-10 / 11-20 / 21-30 / 31-40 / 41-50 Κέντρο Κλάσεων xi είναι το κέντρο της ομαδοποίησης της κλάσης Πχ =5-15…45
Αθροιστική Συχνότητα Ν Αύξων αριθμό κλάσης Κλάσεις Κέντρο Κλάσεων x1 Συχνότητα ν1 Αθροιστική Συχνότητα Ν 1. α0-α1 (α1-α0-1)/2 x1 ν1 N1 2. α1-α2 x2 ν2 N2 3. α2-α3 x3 ν3 N3 ... i αi-1-αi xi νi Ni k αk-1-αk xk νk Nk Σύνολο N
Άσκηση Να ομαδοποιήσετε σε 5 κλάσεις και να βρείτε το κέντρο κλάσης πλήθος τιμών 100
Άσκηση Αύξων αριθμό κλάσης Κλάσεις Κέντρο Κλάσεων x1 1. 2. 3. 4 5