Εισαγωγή στην Στατιστική ΤΕΙ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ Εισαγωγή στην Στατιστική Κουκούμιαλος Στυλιανός «Εισαγωγή στην Στατιστική» / Συνοπτική Παρουσίαση Κεφάλαιο 3 05/10/2015
ΠΙΘΑΝΟΤΗΤΕΣ 1.- Πείραμα τύχης – Δειγματικός χώρος - Ενδεχόμενα 2.- Βασικές πράξεις μεταξύ ενδεχομένων 3.- Ορισμός πιθανότητας 4.- Δεσμευμένη πιθανότητα 5.- Πολλαπλασιαστικός νόμος 6.- Στοχαστική ανεξαρτησία
Πείραμα τύχης – Δειγματικός χώρος -Ενδεχόμενα Τυχαίο φαινόμενο ή πείραμα τύχης: Μία διαδικασία, η οποία κάθε φορά που επαναλαμβάνεται, κάτω από τις ίδιες θεωρητικά συνθήκες μπορεί να οδηγήσει σε περισσότερα από ένα αποτελέσματα. Τυχαίες διαδικασίες : Η ρίψη ενός νομίσματος, το φύλο νεογέννητου, η ζήτηση προϊόντος, ο χρόνος αναμονής σε σημείο εξυπηρέτησης. Δειγματικός χώρος Ω: Το σύνολο των δυνατών αποτελεσμάτων ενός τυχαίου φαινομένου. Ενδεχόμενα: Τα δυνατά αποτελέσματα ενός πειράματος τύχης.
Βασικές πράξεις μεταξύ ενδεχομένων Έστω Α,Β δύο ενδεχόμενα του δειγματικού χώρου Ω Ένωση Α Β: Το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιείται τουλάχιστον ένα από τα ενδεχόμενα Α και Β. Τομή Α Β: Το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιούνται συγχρόνως τα ενδεχόμενα Α και Β. Ξένα ή ασυμβίβαστα ονομάζονται δύο ενδεχόμενα, όταν η πραγματοποίηση του ενός αποκλείει την πραγματοποίηση του άλλου ενδεχομένου. Ισχύει Α Β= , όπου το αδύνατο ενδεχόμενο, το οποίο δεν μπορεί να πραγματοποιηθεί. Συμπληρωματικά: Δύο ενδεχόμενα καλούνται συμπληρωματικά, όταν είναι ξένα και η ένωσή τους είναι ο δειγματικός χώρος. Ισχύει Α Β = και Α Β =Ω Διαφορά Α-Β: Είναι το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιείται το Α και όχι το Β.
Συμπληρωματικά: Δύο ενδεχόμενα καλούνται συμπληρωματικά, Συμπληρωματικά: Δύο ενδεχόμενα καλούνται συμπληρωματικά, όταν είναι ξένα και η ένωσή τους είναι ο δειγματικός χώρος. Ισχύει Α B = και Α B =Ω Το συμπληρωματικό του Α συμβολίζεται με Διαφορά Α-Β: Είναι το ενδεχόμενο που πραγματοποιείται, όταν πραγματοποιείται το Α και όχι το Β. Παράδειγμα: Πείραμα τύχης: Ρίψη ζαριού Ω ={1,2,3,4,5,6} Α= {άρτια ένδειξη}={2,4,6} Β={περιττή ένδειξη}={1,3,5} Γ= {πρώτος αριθμός}={2,3,5} Α Γ={2,3,4,5,6} Β Γ={3,5} Α-Γ={4,6}
Κλασσικός ορισμός πιθανότητας ( Laplace) Ορισμός πιθανότητας Η πιθανότητα μπορεί να θεωρηθεί ως ένα αριθμητικό μέτρο, που εκφράζει τον βαθμό βεβαιότητας να πραγματοποιηθεί ένα ενδεχόμενο Α και συμβολίζεται με Ρ(Α) Κλασσικός ορισμός πιθανότητας ( Laplace) Ρ(Α)= Όπου : αριθμός ευνοϊκών περιπτώσεων για το ενδεχόμενο Α Ν : αριθμός δυνατών περιπτώσεων
Η πιθανότητα σαν σχετική συχνότητα Σε μεγάλο αριθμό επαναλήψεων μίας τυχαίας διαδικασίας, η σχετική συχνότητα με την οποία εμφανίζεται ένα ενδεχόμενο, σταθεροποιείται σταδιακά και προσεγγίζει θετική τιμή την οποία καλούμε πιθανότητα. Η πιθανότητα ορίζεται σαν οριακή τιμή της σχετικής συχνότητας, όταν ο αριθμός των επαναλήψεων αυξάνει απεριόριστα. Ρ(Α) =
Αξιωματικός ορισμός πιθανότητας Η πιθανότητα ορίζεται σαν μία συνάρτηση, η οποία σε κάθε ενδεχόμενο αντιστοιχεί ένα πραγματικό αριθμό, έτσι ώστε να ισχύουν τα εξής αξιώματα 1.- Ρ(Ω) =1 2.- 0≤ Ρ(Α) ≤ 1 3.- Αν ενδεχόμενα ανά δύο ξένα μεταξύ τους, ισχύει
Δεσμευμένη (υπό συνθήκη) πιθανότητα Η πιθανότητα να πραγματοποιηθεί το ενδεχόμενο Α γνωρίζοντας ότι έχει ήδη πραγματοποιηθεί το ενδεχόμενο Β, ονομάζεται δεσμευμένη ή υπό συνθήκη πιθανότητα του Α δοθέντος του Β. Συμβολίζεται Ρ(ΑΒ). Ισχύει Ρ(ΑΒ) =
Πολλαπλασιαστικός νόμος (νόμος σύνθετων πιθανοτήτων) Ισχύει Ρ(ΑΒ)=Ρ(Β)Ρ(ΑΒ)= Ρ(Α)Ρ(ΒΑ) Γενικά για ν τυχαία ενδεχόμενα ισχύει Ρ(Α1 Α2 … Αν)=Ρ(Α1)Ρ(Α2 Α1)Ρ(Α3 Α1 Α2 )….. Ρ(ΑνΑ1 Α2… Αν-1)
Παράδειγμα: Ένα προϊόν ελέγχεται από δύο ελεγκτές διαδοχικά Παράδειγμα: Ένα προϊόν ελέγχεται από δύο ελεγκτές διαδοχικά. Το 10% των ελαττωματικών προϊόντων περνούν τον πρώτο έλεγχο χωρίς να το αντιληφθεί ο 1ος ελεγκτής. Από τα ελαττωματικά προϊόντα που περνούν τον πρώτο έλεγχο, το 50% θα περάσει και τον δεύτερο έλεγχο. Τι ποσοστό ελαττωματικών θα περάσει και τους δύο ελέγχους; Έστω τα ενδεχόμενα Α1={ένα ελαττωματικό προϊόν περνά τον 1ο έλεγχο } Α2={ένα ελαττωματικό προϊόν περνά τον 2ο έλεγχο } Ρ(Α1 Α2)=Ρ(Α1)Ρ(Α2 Α1) =0.1*0.5=0.05
Στοχαστική ανεξαρτησία Στοχαστική ανεξαρτησία Τα ενδεχόμενα Α, Β ονομάζονται στοχαστικά ή στατιστικά ανεξάρτητα, αν η πραγματοποίηση του ενδεχομένου Β δεν επηρεάζει την πραγματοποίηση του Α. Ισχύει Ρ(ΑΒ)=Ρ(Α) = ισοδύναμα Ρ(Α)=Ρ(Α)Ρ(Β) Παράδειγμα: Δύο νομίσματα ρίπτονται ταυτόχρονα. Έστω τα ενδεχόμενα Α={1ο νόμισμα Γράμματα} Β={2ο νόμισμα Γράμματα} Ρ(Α)=1/2 Ρ(Β)=1/2 Ρ(ΑΒ)= 1/4 Ισχύει Ρ(ΑΒ)= Ρ(Α)Ρ(Β) Α, Β στατιστικά ανεξάρτητα
Κατανομές πιθανότητας 1. - Τυχαία μεταβλητή – Συνάρτηση πιθανότητας 2 Κατανομές πιθανότητας 1.- Τυχαία μεταβλητή – Συνάρτηση πιθανότητας 2.- Κατανομές πιθανότητας διακριτών τυχαίων μεταβλητών 3.- Συνάρτηση κατανομής 4.-Μέση τιμή -Διακύμανση
Τυχαία μεταβλητή – Συνάρτηση πιθανότητας Τυχαία ή στοχαστική μεταβλητή: Συνάρτηση, η οποία σε κάθε αποτέλεσμα μίας τυχαίας διαδικασίας, αντιστοιχεί ένα πραγματικό αριθμό. Ασυνεχής: Λαμβάνει αριθμήσιμο πλήθος τιμών. Συνεχής: Λαμβάνει, θεωρητικά, κάθε τιμή σε ένα διάστημα. Συνάρτηση πιθανότητας διακριτής τυχαίας μεταβλητής: αντιστοιχεί σε κάθε τιμή της μεταβλητής Χ την πιθανότητα Ισχύει και
Κατανομή πιθανότητας: Το σύνολο των ζευγών Συνάρτηση κατανομής ( Αθροιστική συνάρτηση πιθανότητας)
Μέση τιμή - Διακύμανση Μέση ή αναμενόμενη τιμή Διακύμανση Μέση τιμή - Διακύμανση Μέση ή αναμενόμενη τιμή Διακύμανση Τυπική απόκλιση
Παράδειγμα Πείραμα τύχης : Ρίψη 2 νομισμάτων Δειγματικός χώρος Ω ={ΚΚ,ΚΓ,ΓΚ,ΓΓ} Τυχαία μεταβλητή Χ: αριθμός εμφάνισης όψης "Γ Η τυχαία μεταβλητή Χ λαμβάνει τις τιμές 0,1,2 με αντίστοιχες πιθανότητες Ρ(Χ=0)=1/4 Ρ(Χ=1)=2/4 Ρ(Χ=2)=1/4 The mean of the data in the sample of 36 CK measurements is given by
Μέση τιμή Ε(Χ)=0*1/4+1*2/4+2*1/4=1 Κατανομή πιθανότητας ¼ 1 2/4 2 1/4 Μέση τιμή Ε(Χ)=0*1/4+1*2/4+2*1/4=1 Διακύμανση Δ(Χ)=1/4*(0-1)2+2/4*(1-1)2+1/4*(2-1)2=2/4 The mean of the data in the sample of 36 CK measurements is given by
Θεωρητικά μαθηματικά υποδείγματα 1. - Διωνυμική κατανομή 2 Θεωρητικά μαθηματικά υποδείγματα 1.- Διωνυμική κατανομή 2.- Κατανομή Poisson 3.- Κανονική κατανομή 4.- Εκθετική κατανομή
Ασυνεχείς κατανομές Διωνυμική κατανομή Έστω μία τυχαία διαδικασία στην οποία διακρίνουμε δύο αποτελέσματα(ενδεχόμενα). Σε κάθε επανάληψη («δοκιμή») της τυχαίας διαδικασίας, πραγματοποιείται το ενδεχόμενο Α(«επιτυχία ») ή το συμπληρωματικό του, με πιθανότητες και
Η τυχαία μεταβλητή Χ: αριθμός εμφάνισης του ενδεχομένου Α σε n δοκιμές ή Χ: αριθμός « επιτυχιών » σε n δοκιμές, ακολουθεί την διωνυμική κατανομή με πεδίο ορισμού {0,1,2,…. n} Συνάρτηση πιθανότητας P(X =κ) = Μέση τιμή Διακύμανση
Παράδειγμα: Το χαρτοφυλάκιο μετοχών, που προτείνεται από έναν επενδυτή αποτελείται από 8 μετοχές διαφόρων κλάδων. Οι διακυμάνσεις στην τιμή των μετοχών είναι ανεξάρτητες μεταξύ τους. Η πιθανότητα να μειωθεί η τιμή μιας μετοχής είναι 0.6. Έστω η τυχαία μεταβλητή Χ: αριθμός μετοχών που παρουσιάζουν μείωση στην τιμή τους. Η τ.μ Χ ακολουθεί διωνυμική κατανομή με n=8, p=0.6 Μέση τιμή Ε(Χ)=8*0.6=4.8 Διακύμανση Δ(Χ)=8*0.6*0.4=1.92 Η πιθανότητα να μειωθεί η τιμή 5 μετοχών είναι
Κατανομή πιθανότητας 0.0007 1 0.0079 2 0.0413 3 0.1239 4 0.2322 5 0.2787 6 0.2090 7 0.0896 8 0.0168
Κατανομή Poisson Η κατανομή Poisson περιγράφει την μεταβλητότητα σε τυχαίες διαδικασίες, όπως αριθμός ατυχημάτων, αριθμός αφίξεων, ζήτηση προϊόντος, σε ορισμένο χρονικό διάστημα. Η τ.μ Χ: αριθμός «συμβάντων» σε ορισμένο διάστημα χρόνου ή χώρου, ακολουθεί κατανομή Poisson, με πεδίο ορισμού {0,1,2,…. } Συνάρτηση πιθανότητας P(X =κ)= Μέση τιμή Ε(Χ)=λ Διακύμανση Δ(Χ)=λ
Παράδειγμα: Από ένα σηματοδότη διέρχονται κατά μέσον όρο, 3 οχήματα ανά 10 δευτερόλεπτα. Η τυχαία μεταβλητή Χ: Αριθμός οχημάτων που διέρχονται ανά 10 δευτερόλεπτα, ακολουθεί κατανομή Poisson με παράμετρο λ=3. Η πιθανότητα να διέλθουν 5 οχήματα σε 10 δευτερόλεπτα είναι Κατανομή πιθανότητας λ=3
Συνεχείς κατανομές Αν μία τυχαία μεταβλητή Χ είναι συνεχής, το σύνολο των δυνατών τιμών της είναι μη αριθμήσιμο. Ισχύει Η συνάρτηση καλείται συνάρτηση πυκνότητας πιθανότητας με και Συνάρτηση κατανομής Η τιμή της συνάρτησης κατανομής ισούται με το εμβαδόν της επιφάνειας που περικλείεται από την καμπύλη της μέχρι και την τιμή . Η πιθανότητα, η μεταβλητή Χ να λαμβάνει τιμές στο διάστημα [α, β] είναι
Κανονική κατανομή Θεωρητικό υπόδειγμα πιθανότητας, που αποτελεί πολύ καλή προσέγγιση για συνεχείς τυχαίες μεταβλητές με συμμετρική κατανομή. Περιγράφει την μεταβλητότητα πολλών συνεχών τυχαίων μεταβλητών, όπως ύψος, βάρος, διάρκεια λειτουργίας. Αποτελεί ικανοποιητική προσέγγιση ασυνεχών κατανομών πιθανότητας (Διωνυμικής, Poisson). Αποτελεί την βάση της στατιστικής επαγωγής, διότι ο μέσος όρος μεγάλου αριθμού παρατηρήσεων ακολουθεί προσεγγιστικά κανονική κατανομή με βάση το κεντρικό οριακό θεώρημα.
Συνάρτηση πυκνότητας πιθανότητας μ: μέση τιμή της κατανομής σ: τυπική απόκλιση της κατανομής Η γραφική παράσταση της συνάρτησης είναι κωδωνοειδής καμπύλη, συμμετρική ως προς την ευθεία x=μ, η οποία καθορίζει το μέσον της κατανομής. Αν η τ.μ Χ ακολουθεί κανονική κατανομή με μέση τιμή μ και τυπική απόκλιση σ, συμβολίζεται με Χ~ Ν (μ, σ). Μία κανονική κατανομή με μέση τιμή μ=0 και τυπική απόκλιση σ=1, καλείται τυποποιημένη κανονική κατανομή και συμβολίζεται ως Ν(0,1). Αν Χ~ Ν (μ, σ), η μεταβλητή
Παράδειγμα: Ο χρόνος ζωής ηλεκτρονικών συσκευών προσεγγίζει κανονική κατανομή με μέση τιμή 12 έτη και τυπική απόκλιση 4.2 έτη. Αν οι συσκευές έχουν εγγύηση για 2 έτη, να υπολογισθεί το ποσοστό των συσκευών που θα έχουν χρόνο ζωής μικρότερο από την εγγύηση. Η τυχαία μεταβλητή Χ: χρόνος ζωής, ακολουθεί προσεγγιστικά κανονική κατανομή δηλαδή Χ ~ Ν(12, 4.2) Η μεταβλητή Το ποσοστό των συσκευών είναι 8.87% Ισχύει λόγω συμμετρίας της κανονικής κατανομής F(-α) =1-F(α) Από τους πίνακες της τυποποιημένης κανονικής κατανομής, η τιμή της συνάρτησης κατανομής, είναι F(2.38) =0.9113
Η πιθανότητα είναι το εμβαδόν της επιφάνειας που περικλείεται από την καμπύλη της κατανομής και την κάθετη ευθεία στο σημείο x=2.
Εκθετική κατανομή Η εκθετική κατανομή προσεγγίζει την κατανομή σχετικών συχνοτήτων του χρόνου μεταξύ δύο τυχαίων γεγονότων π.χ ο χρόνος που μεσολαβεί μεταξύ των αφίξεων σε σημείο εξυπηρέτησης, χρόνος μεταξύ διαδοχικών βλαβών. Το χρονικό διάστημα που μεσολαβεί μέχρι την εμφάνιση του πρώτου τυχαίου γεγονότος, ακολουθεί επίσης εκθετική κατανομή. Μέση τιμή Διακύμανση Τυπική απόκλιση Συνάρτηση κατανομής
Παράδειγμα: Ο χρόνος αναμονής των ασθενών στα εξωτερικά ιατρεία ενός νοσηλευτικού ιδρύματος ακολουθεί εκθετική κατανομή με μέση τιμή μ=50 λεπτά. Να υπολογισθεί η πιθανότητα, ο χρόνος αναμονής να είναι α) μικρότερος από 40 λεπτά β) μεγαλύτερος από μία ώρα. Η τ.μ Χ: χρόνος αναμονής ακολουθεί εκθετική κατανομή. Η παράμετρος λ=1/μ=1/50. α) β)
Η παράμετρος λ καθορίζει την καμπύλη της εκθετικής κατανομής Στο διάγραμμα απεικονίζονται καμπύλες της εκθετικής κατανομής για διάφορες τιμές του λ.