ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΜΕΤΡΗΣΕΩΝ ΤΕΙ ΠΕΙΡΑΙΑ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΧΗΜΕΙΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΛΙΚΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΜΕΤΡΗΣΕΩΝ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΧΗΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΧΗΜΕΙΑΣ ΚΑΘΗΓΗΤΗΣ ΕΥΑΓΓΕΛΟΣ Γ. ΦΟΥΝΤΟΥΚΙΔΗΣ ΔΡ. ΧΗΜΙΚΟΣ ΜΗΧΑΝΙΚΟΣ ΟΙΚΟΝΟΜΟΛΟΓΟΣ Σχεδιασμός: Δρ. Γεώργιος Καρανικολός Επιμέλεια: Δρ. Ευαγγελία Παντατοσάκη
Α. ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ Σφάλματα Α. ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ Σφάλματα Στα αποτελέσματα των μετρήσεων υπεισέρχονται σφάλματα. Για παράδειγμα τα χαρακτηριστικά ενός προϊόντος διαφέρουν από παρτίδα σε παρτίδα ή από συσκευασία σε συσκευασία. Τα αποτελέσματα των αναλύσεων ή των μετρήσεων κατά τον ποιοτικό έλεγχο του προϊόντος παραγωγής μιας βιομηχανίας μπορεί να διαφέρουν παρόλο που χρησιμοποιείται η ίδια μέθοδος ανάλυσης ή μέτρησης ή αξιολόγησης. Διακυμάνσεις οφείλονται στις διαφορετικές τοποθεσίες όπου πραγματοποιήθηκε η μέτρηση, στον αναλυτή, στην ώρα της ημέρας που έγινε η μέτρηση (ένας εργαζόμενος αποδίδει καλύτερα στην αρχή του ωραρίου του παρά στο τέλος που είναι κουρασμένος) κλπ. Για να ελέγξουμε την ποιότητα ενός προϊόντος ή την ακρίβεια των μετρήσεων πρέπει να καθορίσουμε το μέγεθος του σφάλματος. Στις περιπτώσεις αυτές εφαρμόζουμε στατιστικές μεθόδους.
Είδη Σφαλμάτων Τυχαία σφάλματα (Random errors) Οφείλονται σε παράγοντες που δε γνωρίζουμε ή δεν μπορούμε να ελέγξουμε. Οι μετρήσεις μας κατανέμονται ομοιόμορφα γύρω από τη μέση τιμή, ακολουθώντας την κανονική κατανομή. Η έννοια του τυχαίου σφάλματος είναι σχετική και εξαρτάται από την διαθέσιμη μετρητική διάταξη. Για παράδειγμα σε ένα ζυγό ακριβείας τα τυχόν ρεύματα αέρα προκαλούν τυχαία σφάλματα. Συστηματικά σφάλματα (Systematic errors) Οφείλονται σε κάποιο συστηματικό λάθος που γίνεται κατά τη διάρκεια του πειράματος. Για παράδειγμα λανθασμένη ρύθμιση/βαθμονόμηση οργάνου, λανθασμένη μεθοδολογία μέτρησης, μη ακριβής τήρηση της πειραματικής διαδικασίας. Επηρεάζουν κατά το ίδιο μέτρο τις μετρήσεις μας, οι οποίες κατανέμονται γύρω από τη μέση τιμή, που είναι όμως διάφορη της πραγματικής. Λοιπά σφάλματα (Gross errors) Ονομάζονται όλα τα υπόλοιπα σφάλματα που μπορεί να οφείλονται σε σοβαρά λάθη που έγιναν κατά το πείραμα ή σε κάποιο ατύχημα, όπως η καταστροφή ενός κρίσιμου δείγματος ή η βλάβη ενός οργάνου. Είναι στην πλειοψηφία τους οφθαλμοφανή λάθη και ο μόνος τρόπος για να τα εξαλείψουμε είναι να ξανακάνουμε το πείραμα από την αρχή.
Συλλογή και Παρουσίαση Στατιστικών Στοιχείων Απογραφή Συγκεντρώνονται στοιχεία από όλες τις μονάδες του πληθυσμού που θέλουμε να μελετήσουμε σε μια χρονική περίοδο. Δειγματοληψία Εξετάζουμε ένα μικρό μέρος (δείγμα) του πληθυσμού, το οποίο επιλέγουμε κατά τέτοιο τρόπο, ώστε οι πληροφορίες, οι εκτιμήσεις και τα συμπεράσματα που θα πάρουμε από αυτό, να έχουν ισχύ για όλο το σύνολο του πληθυσμού στον οποίον ανήκει το δείγμα. Στην περίπτωση αυτή λέμε ότι το δείγμα είναι αντιπροσωπευτικό του πληθυσμού.
Σημαντικές Στατιστικές Έννοιες Πληθυσμός: Το σύνολο των μετρήσεων ή γενικά των παρατηρήσεων, οι οποίες αναφέρονται σε ένα χαρακτηριστικό ή ιδιότητα των μονάδων του συνόλου που εξετάζουμε. Για πειραματικές μετρήσεις, ο πληθυσμός θεωρητικά, είναι ο άπειρος αριθμός μετρήσεων που μπορούν να εκτελεστούν. Μεταβλητή: Το χαρακτηριστικό ή η ιδιότητα των στατιστικών μονάδων ως προς τo οποίo εξετάζουμε ένα πληθυσμό. Για πειραματικές μετρήσεις είναι το αριθμητικό αποτέλεσμα της πειραματικής μέτρησης, δηλαδή η πειραματική τιμή (xi) i=1,2, ...,ν Δείγμα: Ο αριθμός ν των τιμών μιας μεταβλητής xi (το ν είναι το μέγεθος του δείγματος). Το δείγμα για να είναι αντιπροσωπευτικό του πληθυσμού από τον οποίο προέρχεται πρέπει να έχει επιλεγεί με επιστημονικές μεθόδους δειγματοληψίας.
Παρουσίαση Στατιστικών Στοιχείων Η παρουσίαση των στατιστικών στοιχείων γίνεται με τους στατιστικούς πίνακες και με τα διαγράμματα. Για την κατασκευή του πίνακα συχνοτήτων τα δεδομένα ταξινομούνται σε μικρό πλήθος ομάδων που ονομάζονται κλάσεις. Αφού επιλεγεί ο αριθμός των κλάσεων προσδιορίζεται το εύρος κάθε κλάσης διαιρώντας το εύρος του δείγματος (ανώτερη – κατώτερη τιμή) με τον αριθμό των κλάσεων. Πίνακας επιλογής αριθμού κλάσεων: Μέγεθος δείγματος ν Αριθμός κλάσεων κ Μικρότερο του 20 5 200 - 400 9 20 - 50 6 400 - 700 10 50 - 100 7 700 - 1000 11 100 - 200 8
Πίνακας Κατανομής Συχνοτήτων Παράδειγμα: Κατανομή των μετρήσεων της πυκνότητας ενός διαλύματος 3Μ NaCl από μία ομάδα ν = 50 σπουδαστών σ’ ένα εργαστήριο. Πίνακας κατανομής Συχνοτήτων: Πίνακας κατανομής Συχνοτήτων: α/α Πυκνότητα διαλύματος 3Μ NaCl (g/ml) Αριθμός φοιτητών Συχνότητα νi 1 1,09-1,10 4 2 1,10-1,11 6 3 1,11-1,12 13 1,12-1,13 15 5 1,13-1,14 7 1,14-1,15 Σνi = ν = 50
Μέτρα Θέσης και Διασποράς Μέσος όρος: Διακύμανση: Είναι το άθροισμα των τετραγώνων των αποκλίσεων των τιμών της μεταβλητής από το μέσο όρο της, διαιρούμενο με ν-1. Εκφράζεται σε μονάδες οι οποίες είναι τα τετράγωνα των αρχικών μονάδων της μεταβλητής (π.χ. cm2). (1.3) (1.4)
Μέτρα Θέσης και Διασποράς Τυπική απόκλιση: Η τετραγωνική ρίζα της διακύμανσης. Είναι το μέτρο της διασποράς που χρησιμοποιείται συνήθως στην πράξη. Όσο μεγαλύτερη είναι η τυπική απόκλιση τόσο μεγαλύτερη είναι η διασπορά των παρατηρήσεων από το μέσο όρο. όταν ν ∞ τότε Sv-1 σ, όπου σ η πραγματική τυπική απόκλιση του πληθυσμού. Συντελεστής μεταβλητότητας: Είναι ένα μέτρο διασποράς των τιμών της μεταβλητής από το μέσο όρο. Ορίζεται ως ο λόγος της τυπικής απόκλισης δια του μέσου όρου και συνήθως εκφράζεται ως ποσοστό επί τοις %. Όσο μικρότερος είναι ο συντελεστής μεταβλητότητας, τόσο ποιό ομοιογενές είναι το δείγμα. Γενικά δεχόμαστε ότι ένα δείγμα τιμών μιας μεταβλητής είναι ομοιογενές εάν ο C.V. είναι μικρότερος του 10%. (1.5) (1.6)
Σημαντικά Ψηφία Σημαντικά ψηφία ενός αριθμού είναι όλα τα ψηφία για τα οποία είμαστε βέβαιοι συν ένα ακόμα που είναι αβέβαιο και προκύπτει από εκτίμηση. Για παράδειγμα, όταν εκφράζουμε μία μέτρηση μάζας ως 2,05 g (τρία σημαντικά ψηφία) είμαστε βέβαιοι για τα δύο πρώτα (2,0) αλλά αμφιβάλλουμε για το τελευταίο (5), που προέκυψε από εκτίμηση. Προτείνεται η έκφραση των αριθμών στην τυποποιημένη τους μορφή, σαν δύναμη του 10. Π.χ. 2,5.104: Δύο σημαντικά ψηφία (το 2 είναι βέβαιο και το 5 είναι το πρώτο αβέβαιο). 2,500.104: Τέσσερα σημαντικά ψηφία (τα πρώτα τρία είναι βέβαια ενώ το τελευταίο 0 είναι το πρώτο αβέβαιο). Τα μηδενικά στον αριθμό 0,00263 δεν είναι σημαντικά, γιατί ο αριθμός γράφεται 2,63.10-3 και έχει τρία σημαντικά ψηφία. Ο αριθμός των σημαντικών ψηφίων σε μετρήσεις, εξαρτάται από την ευαισθησία του οργάνου μέτρησης. Στα αναλογικά όργανα, αν η βελόνα του οργάνου βρίσκεται μεταξύ δύο ενδείξεων π.χ. μεταξύ 10,4 και 10,5 τα εκατοστά προκύπτουν κατ΄ εκτίμηση. Δίνουμε για παράδειγμα σαν αποτέλεσμα τον αριθμό 10,47 όπου το 7 είναι το πρώτο αβέβαιο ψηφίο. Προφανώς ο αριθμός 10,47 έχει τέσσερα σημαντικά ψηφία. Στα ψηφιακά όργανα το τελευταίο δεξιά ψηφίο που διαβάζουμε στην οθόνη του οργάνου, είναι αβέβαιο ψηφίο. Για παράδειγμα αν διαθέτουμε ένα ψηφιακό pHμετρο με ευαισθησία εκατοστό του pH και μετρώντας το pH ενός διαλύματος διαβάζουμε την ένδειξη 3,58, το 8 είναι το πρώτο αβέβαιο ψηφίο. Προφανώς ο αριθμός 3,58 έχει τρία σημαντικά ψηφία.
Στρογγυλοποίηση Στρογγυλοποίηση στα σημαντικά ψηφία (όλα τα βέβαια συν το πρώτο αβέβαιο). Παράδειγμα: Παρουσίαση του αριθμού 62,352472 με τρία σημαντικά ψηφία: Εάν ο τελευταίος αριθμός είναι μικρότερος του 5 απαλείφεται και γράφουμε 62,35247. Εάν ο τελευταίος αριθμός είναι μεγαλύτερος του 5 ο προτελευταίος αυξάνεται κατά μία μονάδα, άρα στο δεύτερο βήμα γράφουμε 62,3525. Εάν ο τελευταίος αριθμός είναι 5, ο προτελευταίος, εάν είναι ζυγός παραμένει ως έχει, εάν είναι μονός αυξάνεται κατά μία μονάδα. Έτσι γράφουμε διαδοχικά 62,352 62,35 και τελικά 62,4. Η πράξη μεταξύ δύο ψηφίων δίνει βέβαιο αποτέλεσμα, μόνο αν και τα δύο παράγωγα του αποτελέσματος ψηφία, είναι βέβαια. Πρόσθεση (αφαίρεση): Το άθροισμα (διαφορά) των τιμών δεν πρέπει να περιέχει περισσότερα σημαντικά ψηφία προς τα δεξιά του, από όσα περιέχει ο λιγότερο ακριβής παράγοντας του αθροίσματος (διαφοράς), π.χ. 142,8 + 0,053 =142,853, που στρογγυλοποιείται στο 142,8 Πολλαπλασιασμός (διαίρεση): Το γινόμενο (πηλίκο) των διαφόρων τιμών δεν πρέπει να περιέχει περισσότερα σημαντικά ψηφία, από αυτά που περιέχονται στον παράγοντα του γινομένου (πηλίκου) με τα λιγότερα σημαντικά ψηφία, π.χ. 113,2 Χ 1,43 = 161,876 που στρογγυλοποιείται στο 162, 113,2 : 1,43 = 79,160839 που στρογγυλοποιείται στο 79,2. Σήμερα, αν επιθυμούμε ακρίβεια στους υπολογισμούς, είναι εύκολο στις ενδιάμεσες πράξεις να κρατάμε πολλά ψηφία και να κάνουμε στρογγυλοποίηση μόνο στο τελικό αποτέλεσμα.
Επιπλέον Στατιστικές Έννοιες Αληθινή τιμή (Τ ή μ): Είναι η πραγματική αριθμητική τιμή ενός μεγέθους. Προσεγγίζεται από τον μέσο όρο θεωρητικά άπειρου αριθμού μετρήσεων. Δηλαδή μ όταν ν∞ Απόλυτο σφάλμα: Απόλυτο σφάλμα του μέσου: Σχετικό σφάλμα: Σχετικό σφάλμα %: Ορθότητα (Accuracy): Ορθότητα έχουν οι μετρήσεις μας όταν είναι ομοιόμορφα κατανεμημένες γύρω από το σωστό αποτέλεσμα. Δηλαδή, ο μέσος όρος των μετρήσεων συμπίπτει ή είναι πολύ κοντά στην αληθινή τιμή. Μέτρο της ορθότητας είναι το απόλυτο σφάλμα του μέσου. Ακρίβεια (Precision): Ακρίβεια έχουν οι μετρήσεις μας, όταν είναι κατανεμημένες πολύ στενά γύρω από τον μέσο όρο (που μπορεί να είναι διαφορετικός από την αληθινή τιμή). Μέτρο της ακρίβειας είναι η τυπική απόκλιση. (1.7) (1.8) (1.9) (1.10)
Επιπλέον Στατιστικές Έννοιες Επαναληψιμότητα (Repeatability): Επαναληψιμότητα έχουν οι μετρήσεις μας όταν στην ίδια δειγματοληψία τα αποτελέσματα χαρακτηρίζονται από ακρίβεια. Αναπαραγωγισιμότητα (Reproducibility): Αναπαραγωγισιμότητα έχουν οι μετρήσεις μας όταν τα αποτελέσματά μας πάλι έχουν ακρίβεια, αλλά σε διαφορετικές δειγματοληψίες. Ευαισθησία (Sensitivity): Είναι η ελάχιστη μεταβολή στο μετρούμενο μέγεθος, που μπορεί να δείξει το όργανο μέτρησης. Αναγνωσιμότητα (Readability): Είναι η ελάχιστη μεταβολή που μπορούμε να διαβάσουμε στην κλίμακα ανάγνωσης του οργάνου. Χρονική σταθερά απόκρισης (Time constant): Είναι ο χρόνος που απαιτείται για να φθάσει η ανάγνωση σε όργανο μέτρησης το 63,2% της τελικής τιμής, μετά από βαθμωτή (απότομη) μεταβολή του ερεθίσματος. Διακρίβωση (Calibration): Διακρίβωση ονομάζουμε όλες τις εργασίες που αποσκοπούν στο να προσδιοριστούν οι τιμές των σφαλμάτων μετρητικού οργάνου.
Επίπεδα Aξιοπιστίας ή Διάστημα Εμπιστοσύνης Το διάστημα μέσα στο οποίο βρίσκεται η αληθινή τιμή με κάποια βεβαιότητα ορίζεται από δύο τιμές οι οποίες λέγονται όρια αξιοπιστίας (confidence limits). Τα όρια αξιοπιστίας προσδιορίζονται από: το μέγεθος του δείγματος τη στατιστική διακύμανση το βαθμό αξιοπιστίας με την οποία θέλουμε να δώσουμε το αποτέλεσμα. Ο βαθμός αξιοπιστίας ή η πιθανότητα (Ρ) εκφράζεται είτε επί τοις % από το 0 έως 100 είτε από 0 έως 1. Η αβεβαιότητα (α) λέγεται επίπεδο σημαντικότητας και εκφράζεται είτε επί τοις % από 0 έως 100 είτε από 0 έως 1. Για παράδειγμα αν δίνεται ότι Ρ = 95% ή Ρ=0,95 τότε επειδή Ρ + α = 100% ή Ρ + α = 1 το α = 5% ή α = 0,05.
Χρήση Κατανομής t του Student Χρήση: Όταν είναι άγνωστη η σ και την εκτιμώ από δείγμα με πλήθος ν μετρήσεων (βρίσκω το Sv-1). α) Εύρεση κάτω ορίου για μεμονωμένες τιμές (xi) xi; = xi,min; ≤ - t(a, (v-1)) . Sv-1 (1.25) β) Εύρεση κάτω ορίου για μέσους όρους ( ): ; = ; = μmin ; ≤ - t(a, (v-1)) . (1.26) γ) Διάστημα εμπιστοσύνης μέσης τιμής (με πιθανότητα Ρ) - t (a/2, (v-1)) . ≤ μ ≤ + t (a/2, (v-1)) . (1.27) π.χ. αν Ρ=95% ή Ρ=0,95 => α=5% ή α=0,05 και α/2=0,025 ή α/2=2,5%
Χρήση Πινάκων για την Κατανομή t του Student Τα t(a, (v-1)) ή t(a/2, (v-1)) είναι στατιστικοί δείκτες της κατανομής student που αντιστοιχούν σε αβεβαιότητα α ή α/2 και (ν-1) βαθμούς ελευθερίας. Η τιμή του t(a, (v-1)) ή t(a/2,(v-1)) προκύπτει από τον πίνακα κατανομής student, που είναι πίνακας διπλής εισόδου. Ο πίνακας αυτός έχει στην πρώτη στήλη τους βαθμούς ελευθερίας και στην κάτω σειρά την αβεβαιότητα (α) ή το μισό της δηλ. το α/2. Η τιμή του t(a, (v-1)) προκύπτει από την διασταύρωση της στήλης με τιμή α και της σειράς με (ν-1) βαθμούς ελευθερίας. Η τιμή του t(a/2, (v-1)) προκύπτει από την διασταύρωση της στήλης με τιμή α/2 και της σειράς με (ν-1) βαθμούς ελευθερίας.
Β. ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ Εκτελούνται επαναλαμβανόμενες μετρήσεις μιας μεταβλητής σύμφωνα με τις οδηγίες του καθηγητή. Υπολογίζονται, για κάθε περίπτωση, η μέση τιμή, η τυπική απόκλιση και το διάστημα εμπιστοσύνης της μέσης τιμής με δεδομένη πιθανότητα. Ζύγιση σε αναλυτικό ζυγό Ο αναλυτικός ζυγός (τύπου Metler) έχει ευαισθησία (Sensitivity) τέταρτου δεκαδικού ψηφίου του γραμμαρίου. Ο ζυγός για να μην επηρεάζεται η ζύγιση από ρεύματα αέρα, έχει παραθυράκια που ανοίγουν για να τοποθετήσουμε στον δίσκο το προς ζύγιση αντικείμενο, ενώ όταν μηδενίζουμε τον ζυγό ή πραγματοποιούμε την ζύγιση τα παραθυράκια πρέπει να είναι κλειστά. Όταν θέλουμε να ζυγίσουμε ένα αντικείμενο (π.χ. κέρμα) δεν αρκούμεθα σε μια μόνο ζύγιση, αλλά πραγματοποιούμε περισσότερες και υπολογίζουμε τον μέσο όρο των μετρήσεων. Με αυτό τον τρόπο περιορίζουμε την επίδραση των τυχαίων σφαλμάτων (π.χ. Μικροδονήσεις, ρεύματα αέρα κ.λ.π.) στο αποτέλεσμα.
Πειραματική Διαδικασία Ζύγισης Με κλειστά τα παραθυράκια του ζυγού, ενεργοποιούμε τον ζυγό και μηδενίζουμε την ένδειξη του ζυγού. Ανοίγουμε το πλευρικό παράθυρο και τοποθετούμε το προς ζύγιση αντικείμενο (π.χ. κέρμα) στον δίσκο του ζυγού. Κλείνουμε το πλευρικό παράθυρο και περιμένουμε να σταθεροποιηθεί η ένδειξη του ζυγού. Καταγράφουμε την ένδειξη και απενεργοποιούμε τον ζυγό. Επαναλαμβάνομε την ίδια διαδικασία ν = 10 φορές, όπου ν το μέγεθος του δείγματος. Σημειώνουμε ότι ο χειρισμός του κέρματος γίνεται με την βοήθεια λαβίδας, ώστε το κέρμα να μην έρχεται σε επαφή με τα δάκτυλα, που μπορεί να αφήσουν στο κέρμα ίχνη ιδρώτα ή λίπους και έτσι να αλλοιωθεί το αποτέλεσμα της ζύγισης.
Επεξεργασία Μετρήσεων Zύγισης Υπολογίζονται η μέση τιμή (xν), η τυπική απόκλιση (Sν-1) και το διάστημα εμπιστοσύνης της μέσης τιμής (με τη βοήθεια της κατανομής STUDENT), με πιθανότητα Ρ = 95%. Δίνεται από τον καθηγητή η αληθής τιμή Τ του αντικειμένου, οπότε υπολογίζεται και το απόλυτο σφάλμα του μέσου xν –T . Για διευκόλυνση των υπολογισμών κατασκευάζουμε τον ακόλουθο πίνακα: ( ( ν xi (g) xν xν- xi (xν - xi)2 1 2 . Σ (xν- xi)2
Μέτρηση pΗ διαλύματος Η πειραματική διάταξη αποτελείται από ένα ψηφιακό pΗμετρο με ευαισθησία εκατοστό του pΗ, και το ηλεκτρόδιό του. Για να επιτύχουμε ορθότητα στις μετρήσεις μας, δηλαδή για να εξαλείψουμε τυχόν συστηματικά σφάλματα, ακολουθούμε την διαδικασία της διακρίβωσης (Calibration): Ρυθμίζουμε το pΗμετρο αρχικά με ρυθμιστικό διάλυμα σταθερού pΗ = 7, κάνοντας τους κατάλληλους χειρισμούς. Ακολούθως, εάν πρόκειται να μετρήσουμε σε όξινη περιοχή, κάνουμε δεύτερη ρύθμιση με την βοήθεια όξινου ρυθμιστικού διαλύματος ορισμένου pΗ (π.χ. pΗ=4). Εάν πρόκειται να μετρήσουμε σε βασική περιοχή, κάνουμε την δεύτερη ρύθμιση με την βοήθεια βασικού ρυθμιστικού διαλύματος ορισμένου pΗ (π.χ. pΗ=11).
Πειραματική Διαδικασία Μέτρησης pH Ενεργοποιούμε το pΗμετρο με τον επιλογέα στην θέση pΗ. Βυθίζουμε το ηλεκτρόδιο στο δοχείο που περιέχει το διάλυμα το pΗ του οποίου θέλουμε να μετρήσουμε και περιμένουμε να σταθεροποιηθεί η ένδειξη του οργάνου. Καταγράφουμε την ένδειξη και απενεργοποιούμε το pΗμετρο. Επαναλαμβάνομε την ίδια διαδικασία ν = 8 φορές, όπου ν το μέγεθος του δείγματος. Η επανάληψη της μέτρησης αρκετές φορές περιορίζει την επίδραση των τυχαίων σφαλμάτων στο αποτέλεσμα. Σημειώνουμε ότι ο χειρισμός του ηλεκτροδίου πρέπει να γίνεται με προσοχή, ώστε να αποφευχθεί ο κίνδυνος καταστροφής του (θραύση).
Επεξεργασία Μετρήσεων pH Υπολογίζονται η μέση τιμή (xν), η τυπική απόκλιση (Sν-1) και το διάστημα εμπιστοσύνης της μέσης τιμής (με την βοήθεια της κατανομής STUDENT), με πιθανότητα Ρ = 95%. Για διευκόλυνση των υπολογισμών κατασκευάζουμε τον ακόλουθο πίνακα: ( ( ν xi (pH) xν xν- xi (xν - xi)2 1 2 . Σ(xν - xi)2
ΠΑΡΑΡΤΗΜΑ
Σχετική Συχνότητα Ορισμός: Η σχετική συχνότητα ταυτίζεται με τη μαθηματική πιθανότητα. Αν εκτελέσουμε ένα πείραμα τύχης ν φορές και το ενδεχόμενο Α εμφανισθεί νi φορές, τότε η πιθανότητα Ρ(Α) να εμφανισθεί το ενδεχόμενο Α είναι : Η σχετική συχνότητα ταυτίζεται με τη μαθηματική πιθανότητα. Αν εκτελέσουμε ένα πείραμα τύχης ν φορές και το ενδεχόμενο Α εμφανισθεί νi φορές, τότε η πιθανότητα Ρ(Α) να εμφανισθεί το ενδεχόμενο Α είναι : Η σχετική συχνότητα ταυτίζεται με τη μαθηματική πιθανότητα. Αν εκτελέσουμε ένα πείραμα τύχης ν φορές και το ενδεχόμενο Α εμφανισθεί νi φορές, τότε η πιθανότητα Ρ(Α) να εμφανισθεί το ενδεχόμενο Α είναι : (1.2) Πυκνότητα διαλύματος 3Μ NaCl (gr/ml) Κεντρικές τιμές xi Σχετική Συχνότητα ή Πιθανότητα fi 1,09-1,10 1,095 4:50 = 0,08 1,10-1,11 1,105 6:50 = 0,12 1,11-1,12 1,115 13:50 = 0,26 1,12-1,13 1,125 15:50 = 0,30 1,13-1,14 1,135 7:50 = 0,14 1,14-1,15 1,145 5:50 = 0,10 Σ fi = Σνi/ν = 1 Πίνακας κατανομής Σχετικών Συχνοτήτων ή Πιθανότητας:
Στατιστικά Διαγράμματα 1,09 1,10 1,11 1,12 1,13 1,14 1,15 20 15 νi 10 5 0,0 Ιστόγραμμα Συχνοτήτων 1,09 1,10 1,11 1,12 1,13 1,14 1,15 0,40 0,30 fi 0,20 0,10 0,0 Ιστόγραμμα Σχετικών Συχνοτήτων Πυκνότητα διαλύματος Χ
Πολύγωνο Συχνοτήτων Πυκνότητα διαλύματος Χ 1,09 1,10 1,11 1,12 1,13 1,14 1,15 0,4 0,3 f i 0,2 0,1 0,0 Προκύπτει ενώνοντας τα μέσα της άνω πλευράς των ορθογωνίων Προκύπτει ενώνοντας τα μέσα της άνω πλευράς των ορθογωνίων Επειδή το πολύγωνο συχνοτήτων δημιουργεί ίσα τρίγωνα, το συνολικό εμβαδόν των ορθογωνίων, είναι ίσο με το εμβαδόν που περικλείεται μεταξύ της τεθλασμένης γραμμής και του άξονα των Χ Όταν το πλήθος των δεδομένων είναι αρκετά μεγάλο, το εύρος των τάξεων μπορεί να μικρύνει και η τεθλασμένη γραμμή της κατανομής συχνοτήτων τείνει να πάρει τη μορφή καμπύλης, η οποία ονομάζεται καμπύλη συχνοτήτων
Κατανομές Συχνοτήτων Στο πολύγωνο συχνοτήτων, όταν το πλήθος των δεδομένων είναι μεγάλο, το εύρος των κλάσεων (dx) μπορεί να μικρύνει. Εάν στον άξονα των Ψ μετράμε αντί για την σχετική συχνότητα fi το fi/ dx, τότε το εμβαδόν ενός ορθογωνίου παραλληλογράμμου είναι (fi/dx).dx και το εμβαδόν όλων των παραλληλογράμμων είναι: Σ(fi/ dx).dx = Σfi = 1 Επομένως και το εμβαδόν που περικλείεται από το πολύγωνο συχνοτήτων και τον άξονα των Χ είναι ίσον με 1. Όταν το πλήθος των δεδομένων είναι μεγάλο (ν∞), το πλήθος των κλάσεων μπορεί να μεγαλώσει και επομένως το εύρος των κλάσεων (dx) μπορεί να μικρύνει (dx0) και το πολύγωνο συχνοτήτων τείνει να πάρει τη μορφή λείας καμπύλης, η οποία ονομάζεται καμπύλη συχνοτήτων. fi/ dx Το εμβαδόν μεταξύ της καμπύλης συχνοτήτων και του άξονα των Χ είναι ίσον με 1. Το εμβαδόν μεταξύ της καμπύλης συχνοτήτων και του άξονα των Χ είναι ίσον με 1. Χ
Κανονική Κατανομή ή Κατανομή του Gauss (1.11) (1.11) όπου x : συνεχής μεταβλητή στο διάστημα (-∞,+∞) μ : μέση ή αληθινής τιμής x -μ : το μέγεθος της απόκλισης, δηλ. η διαφορά μεταξύ της τιμής x και της αληθινής τιμής μ σ : η τυπική απόκλιση e : 2,7183 η βάση των φυσικών λογαρίθμων π : 3,14 Μια κανονική κατανομή με μέση τιμή μ και τυπική απόκλιση σ συμβολίζεται και σαν Ν(μ,σ). Η κατανομή των τυχαίων σφαλμάτων ακολουθεί το νόμο της κανονικής κατανομής του Gauss.
Kανονική Kατανομή κατά Gauss + -
Xαρακτηριστικά Kανονικής Kατανομής Η μέση τιμή (μ) για άπειρο αριθμό μετρήσεων συμπίπτει με την αληθινή τιμή και αντιστοιχεί στη μέγιστη πιθανότητα. Η τεταγμένη της μέγιστης τιμής είναι άξονας συμμετρίας της καμπύλης, η δε τυπική απόκλιση (σ) είναι η απόσταση των σημείων καμπής από τον άξονα συμμετρίας. Λόγω της συμμετρίας της καμπύλης τα θετικά και τα αρνητικά σφάλματα είναι εξίσου πιθανά. Η πιθανότητα των μεγάλων σφαλμάτων είναι μικρή, ενώ τα μικρά σφάλματα είναι πιο πιθανά. Το πλάτος της κανονικής καμπύλης κατανομής υποδηλώνει την ακρίβεια των μετρήσεων. Όσο μεγαλύτερη είναι η ακρίβεια τόσο μικρότερο είναι το (σ) άρα και το άνοιγμα της καμπύλης. Η αληθινή τιμή (μ) επηρεάζει την καμπύλη κατανομής από πλευράς θέσης, η δε τυπική απόκλιση (σ) από άποψη σχήματος. Το εμβαδόν κάτω από την κανονική καμπύλη από -∞ έως και +∞ ισούται με τη μονάδα.
Μαθηματική Επεξεργασία Kανονικής Kατανομής (1.12) Eμβαδόν: Πιθανότητα μια τυχαία μεταβλητή x να πάρει τιμή: Εισαγωγή γραμμικού μετασχηματισμού: z = Οι μονάδες του z είναι καθαροί αριθμοί. Αν μία τυχαία μεταβλητή x ακολουθεί την κανονική κατανομή που έχει μέσο αριθμητικό μ και τυπική απόκλιση σ τότε η τυχαία μεταβλητή z ακολουθεί την κανονική κατανομή που έχει μέσο αριθμητικό 0 και τυπική απόκλιση 1. Αυτή η κατανομή λέγεται τυποποιημένη κανονική κατανομή και συμβολίζεται σαν Ν(0,1). (1.13) (1.14)
Κεντρικό Οριακό Θεώρημα Αν μία τυχαία μεταβλητή x κατανέμεται κανονικά, τότε οι μέσοι όροι των δειγμάτων κατανέμονται κανονικά με μέσο αριθμητικό ίσο με το μέσο αριθμητικό του πληθυσμού: και διακύμανση ίση με τη διακύμανση του πληθυσμού αφού διαιρεθεί με το μέγεθος του δείγματος: Αυτό όμως δεν ισχύει όταν η κατανομή του πληθυσμού δεν είναι κανονική. Ανεξάρτητα όμως από τη μορφή της κατανομής του γεννήτορα πληθυσμού, αν το μέγεθος του δείγματος είναι αρκετά μεγάλο (ν>30), τότε η κατανομή των μέσων δειγμάτων τείνει να γίνει κανονική, όσο αυξάνει το μέγεθος του δείγματος με μέσο: και τυπική απόκλιση (1.16) Το θεώρημα αυτό ονομάζεται κεντρικό οριακό θεώρημα και ισχύει για συνεχείς και ασυνεχείς κατανομές. (1.15)
Κατανομή Χ2 Έστω οι τυχαίες μεταβλητές x1,x2,….xν που είναι ανεξάρτητες μεταξύ τους και κάθε μία κατανέμεται κανονικά με μέση τιμή 0 και διακύμανση 1. Το άθροισμα των τετραγώνων τους (1.17) δεν κατανέμεται όπως η κανονική κατανομή, αλλά ακολουθεί την κατανομή Χ2 (0 < x2 < +∞). Αν από έναν κανονικό πληθυσμό πάρουμε ένα τυχαίο δείγμα x1, x2, ….xν τότε και το άθροισμα: ακολουθεί την κατανομή Χ2, δηλαδή: αλλά επειδή , προκύπτει: (1.18) όπου σ2 η διακύμανση του πληθυσμού.
Κατανομή t του Student Αν η τυχαία μεταβλητή z ακολουθεί την κανονική κατανομή με μέση τιμή 0 και διακύμανση 1 και Υ μία άλλη μεταβλητή, ανεξάρτητη της Χ, που ακολουθεί την κατανομή x2 με ν = n-1 βαθμούς ελευθερίας, τότε η τυχαία μεταβλητή: ακολουθεί την κατανομή t με ν βαθμούς ελευθερίας. Αν στην παραπάνω σχέση θέσουμε και τότε θα έχουμε: με (1.19)
Χρήσεις Κατανομών στον Έλεγχο Ποιότητας Κανονική κατανομή: Χρήση: Όταν είναι γνωστή η σ του πληθυσμού α) Εύρεση κάτω ορίου για μεμονωμένες τιμές (xi): xi; = xi,min; ≤ μ - |z|.σ, αν μ γνωστή (1.20) xi; = xi,min; ≤ - |z|.σ, αν μ άγνωστη (1.21) β) Εύρεση κάτω ορίου για μέσους όρους ( ): ; = ; = μmin; ≤ μ - |z| , αν μ γνωστή (1.22) Αν μ άγνωστο, τότε στη σχέση (3) μ =
Χρήση Κατανομής Χ2 Χρήση: Εύρεση ορίων για την τυπική απόκλιση α) Αν σ άγνωστο (Sv-1 γνωστό από δείγμα πλήθους ν) Εύρεση άνω ορίου σ > σmax; πάνω από το οποίο αναμένεται να βρίσκεται το α% των υπολογιζόμενων Sv-1 από ν-άδες δειγμάτων. (1.23) β) Αν σ γνωστό. Εύρεση άνω ορίου Sv-1 ; > Smax ; πάνω από το οποίο αναμένεται να βρίσκεται το α% των υπολογιζόμενων Sv-1 από ν-άδες δειγμάτων. (1.24)
Χρήση Πινάκων για την Κατανομή Χ2 Τα Χ2 (α, (ν-1)) ή Χ2((1-α), (ν-1)) είναι στατιστικοί δείκτες της κατανομής Χ2. Η τιμή του Χ2(α, (ν-1)) ή Χ2((1-α), (ν-1)) προκύπτει από τον πίνακα της κατανομής Χ2, που είναι πίνακας διπλής εισόδου. Ο πίνακας αυτός έχει στην πρώτη στήλη τους βαθμούς ελευθερίας και στην πρώτη σειρά την αβεβαιότητα (α) %. Η τιμή του Χ2(α, (ν-1)) προκύπτει από την διασταύρωση της στήλης με τιμή α% και της σειράς με (ν-1) βαθμούς ελευθερίας. Η τιμή του Χ2((1-α), (ν-1)) προκύπτει από την διασταύρωση της στήλης με τιμή 1-α και της σειράς με (ν-1) βαθμούς ελευθερίας. Προσοχή! Αν α = 5% ή α=0,05 τότε 1-α=0,95 ή 95%. Από τον πίνακα της Χ2 βρίσκω το Χ2(95%, ν-1) και όχι το Χ2 (5%, ν-1).
Απόρριψη Πειραματικής Τιμής Όταν υπάρχουν διαθέσιμες λίγες πειραματικές τιμές (λιγότερες από δέκα) και κάποια από αυτές φαίνεται να είναι λάθος, γιατί απέχει πολύ από τον μέσο όρο των μετρήσεων, για να αποφασίσουμε αν θα δεχθούμε την τιμή αυτή ή θα την απορρίψουμε και θα προχωρήσουμε στην στατιστική επεξεργασία των υπόλοιπων πειραματικών τιμών, μπορούμε να εφαρμόσουμε ένα αξιόπιστο κριτήριο, που είναι γνωστό σαν Q-test. Για την εφαρμογή του Q-test προσδιορίζουμε την τιμή του Q από την σχέση: (1.28)
Απόρριψη Πειραματικής Τιμής Η τιμή που προκύπτει συγκρίνεται με την τιμή που δίνεται από τον παρακάτω Πίνακα. Αν Q (πειραματική) > Q (πίνακα) η τιμή απορρίπτεται με πιθανότητα 90%. Αριθμός μετρήσεων ν Τιμή Q 3 0.94 7 0.51 4 0.76 8 0.47 5 0.64 9 0.44 6 0.56 10 0.41 Σημείωση: Το Q-test δεν εφαρμόζεται όταν έχουμε τρεις μετρήσεις εκ των οποίων οι δύο είναι ίδιες και η τρίτη διαφέρει. Στην περίπτωση αυτή το Q-test δείχνει ότι τρίτη τιμή δεν γίνεται δεκτή, γιατί Q (πειραματική) =1. Το αυτό ισχύει και για τέσσερις μετρήσεις όταν οι τρεις είναι ταυτόσημες κλπ.
Παραδείγματα Παράδειγμα 1: Μία συνεχή τυχαία μεταβλητή x ακολουθεί την κανονική κατανομή με μέσο αριθμητικό 10 (μ=10) και τυπική απόκλιση 2 (σ=2). Να υπολογισθεί η πιθανότητα: (α) P(x <12), (β) P( ), (γ) P(x>11). Λύση: Θα χρησιμοποιήσουμε το γραμμικό μετασχηματισμό: z = και έχουμε: α) P(x ≤ 12) = P Από τον πίνακα τυποποιημένης κατανομής βρίσκουμε ότι για z = ±1, Α = 0,6827 και 1-Α = 0,3173 Επομένως: P(z<1) = Α + (1-Α)/2 = 0,6827+ 0,3173/2 = 0,84135 ή Ρ = 84,135%
Παράδειγμα 1 β) P(7χ<10) = P = P = P(-1,5 ≤ z ≤0) γ) P(x>11) = P P(z ≥ 0,5) Από τον πίνακα τυποποιημένης κατανομής βρίσκουμε ότι για z = ±0,5 1-Α = 0,6171 Επομένως P = (1-Α)/2 = 0,6171/2 = 0,30855 ή Ρ = 30,855%
Παράδειγμα 2 Έγινε προσδιορισμός νικελίου σε άγνωστο δείγμα τέσσερις φορές και έδωσε τα παρακάτω αποτελέσματα: X : 10,1 9,8 10,2 και 9,9 σε ppm. Να υπολογιστεί το διάστημα εμπιστoσύνης της μέσης τιμής (μ) με πιθανότητα 95%. Λύση: Ο μέσος όρος και η τυπική απόκλιση είναι: xi (xi - )2 10,1 (10,1-10)2 9,8 ( 9,8-10)2 10,2 ( 10,2-10)2 9,9 (9,9-10)2
Παράδειγμα 2 s = ppm Το διάστημα εμπιστοσύνης βρίσκεται από τον τύπο (1.27) : - t (a/2, (v-1)) . ≤ μ ≤ + t (a/2, (v-1)) . Όπου = 10,0 ppm, Sv-1 =0,18 ppm, v = 4, η πιθανότητα είναι 95% δηλ. Ρ=95% ή Ρ=0,95 και η αβεβαιότητα α=5% ή α=0,05 οπότε α/2 = 2,5% ή α/2 = 0,025. Οι βαθμοί ελευθερίας θα είναι ν-1 = 4-1 = 3. Από τον πίνακα κατανομής του student: t (a/2,(v-1)) = t(0.025, 3) = 3,182 οπότε: 9,71 < μ < 10,29 Αυτό σημαίνει ότι η πραγματική μέση τιμή μ βρίσκεται μεταξύ 9,71 και 10,29 με πιθανότητα 95%.
Παράδειγμα 3 Κυβικά δοκίμια σκυροδέματος ελέγχονται για αντοχή σε θλίψη. Σε ένα δείγμα 10 δοκιμίων (ν=10) βρίσκεται ο μέσος όρος = 30 ΜΡα, ενώ είναι γνωστή η τυπική απόκλιση σ = 3ΜΡα του πληθυσμού από τον οποίο προέρχεται το δείγμα. α) Να βρεθεί το όριο xi,min κάτω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των μεμονωμένων τιμών xi. β) Να βρεθεί το όριο κάτω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των άπειρων μέσων όρων που μπορεί να προκύψουν από άπειρες επαναλήψεις της δειγματοληψίας. γ) Να βρεθεί το όριο Smax πάνω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των τυπικών αποκλίσεων Sv-1 που μπορεί να υπολογισθούν από επαναλήψεις της δειγματοληψίας.
Λύση Παραδείγματος 3 α) Επειδή η τυπική απόκλιση του πληθυσμού είναι γνωστή (σ = 30), θα χρησιμοποιήσω την κανονική κατανομή: Επειδή α =(1-Α)/2 =0,05, προκύπτει Α=0,9 και από πίνακα βρίσκω z= 1,645. Ισχύει ο τύπος (1.21): xi,min ; ≤ - |z|.σ = 30-1,645.3 = 25,06 ΜΡα β) Ισχύει ο τύπος (1.22): ≤ - |z| = 30 – 1,645. = 28,44 ΜΡα γ) Θα χρησιμοποιήσω την Χ2 Επειδή η τυπική απόκλιση του πληθυσμού είναι γνωστή (σ = 30), ισχύει ο τύπος (1.24): = = = 4,11 ΜΡα
Παράδειγμα 4 Κυβικά δοκίμια σκυροδέματος ελέγχονται για αντοχή σε θλίψη. Σε ένα δείγμα 10 δοκιμίων (ν=10) βρίσκεται ο μέσος όρος = 30 ΜΡα και η τυπική απόκλιση Sv-1 =3 ΜΡα του δείγματος. α) Να βρεθεί το όριο xi,min κάτω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των μεμονωμένων τιμών xi. β) Να βρεθεί το όριο κάτω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των άπειρων μέσων όρων που μπορεί να προκύψουν από άπειρες επαναλήψεις της δειγματοληψίας. γ) Να βρεθεί το όριο σmax πάνω από το οποίο αναμένεται να βρίσκεται το 5% (α=0,05) των τυπικών αποκλίσεων Sv-1 που μπορεί να υπολογισθούν από επαναλήψεις της δειγματοληψίας.
Λύση Παραδείγματος 4 α) Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, θα χρησιμοποιήσω την κατανομή t του student. Ισχύει ο τύπος (1.25): xi,min ≤ - t (a, (v-1)) . Sv-1 = - t (5%, 9) . Sv-1 = 30 – 1,833.3 = 24,50 ΜΡα β) Ισχύει ο τύπος (1.26): ≤ - t (a, (v-1)) . = 30 – 1,833. = 28,26 ΜΡα γ) Θα χρησιμοποιήσω την Χ2 Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, ισχύει ο τύπος (1.23): σmax = = 4,93 ΜΡα α) Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, θα χρησιμοποιήσω την κατανομή t του student. Ισχύει ο τύπος (1.25): xi,min ≤ - t (a, (v-1)) . Sv-1 = - t (5%, 9) . Sv-1 = 30 – 1,833.3 = 24,50 ΜΡα β) Ισχύει ο τύπος (1.26): ≤ - t (a, (v-1)) . = 30 – 1,833. = 28,26 ΜΡα γ) Θα χρησιμοποιήσω την Χ2 Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, ισχύει ο τύπος (1.23): σmax = = 4,93 ΜΡα
Παράδειγμα 5 Κυβικά δοκίμια σκυροδέματος ελέγχονται για αντοχή σε θλίψη. Σε ένα δείγμα 10 δοκιμίων (ν=10) βρίσκεται ο μέσος όρος = 30 ΜΡα και η τυπική απόκλιση Sv-1 =3 ΜΡα του δείγματος. α) Να βρεθεί το ποσοστό (α) των μεμονωμένων τιμών (xi) που αναμένεται να είναι μικρότερες από xi,min = 24,50 ΜΡα. β) Να βρεθεί το ποσοστό (α) των μέσων όρων που μπορεί να προκύψουν από επαναλήψεις της δειγματοληψίας, που αναμένεται να είναι μικρότεροι από την τιμή = 28,26 ΜΡα. γ) Να βρεθεί το ποσοστό (α) των τυπικών αποκλίσεων Sv-1, που μπορεί να προκύψουν από επαναλήψεις της δειγματοληψίας, που αναμένεται να είναι μεγαλύτερες από την τιμή σmax = 4,93 ΜΡα.
Λύση Παραδείγματος 5 α) Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, θα χρησιμοποιήσω την κατανομή t του student. Ισχύει ο τύπος (1.25): xi,min ≤ - t (a, (v-1)) . Sv-1 = 30 – t(a, 9).3 = 24,50 ΜΡα από όπου προκύπτει t (a, 9) = 1,833 και από πίνακα βρίσκω α = 0,05 ή 5% β) Ισχύει ο τύπος (1.26): ≤ - t (a, (v-1)) . = 30 – t(a, 9). = 28,26 ΜΡα από όπου προκύπτει t(a, 9) = 1,833 και από πίνακα βρίσκω α = 0,05 ή 5% γ) Θα χρησιμοποιήσω την Χ2 Επειδή η τυπική απόκλιση του πληθυσμού (σ) είναι άγνωστη, ισχύει ο τύπος (1.23): σmax ή 4,93 => = 3,33 και α= 5%