PDF Histogram Συνεχούς Τυχαίας Μεταβλητής Εφαρμογή στην περίπτωση εκθετικά κατανεμημένης τυχαίας μεταβλητής Νίκος Κωστόπουλος 21/3/2018
Περιγραφή του προβλήματος Το απλό ιστόγραμμα μίας συνεχούς τυχαίας μεταβλητής (Continuous Random Variable) απαιτεί τροποποιήσεις ώστε να περιγράφει την Probability Density Function (PDF) της μεταβλητής αυτής. Η κατασκευή ενός ιστογράμματος περιλαμβάνει δύο ελεύθερες μεταβλητές: (α) τον αριθμό των δειγμάτων της τυχαίας μεταβλητής. (β) το πλάτος των κλάσεων. Για να πάρουμε ιστόγραμμα που να περιγράφει την PDF (PDF histogram) της συνεχούς τυχαίας μεταβλητής πρέπει αυτό να συγκλίνει στην πραγματική PDF για μεγάλες τιμές των παραπάνω μεταβλητών. Ο κώδικας που ακολουθεί παράγει αρχικά 100000 ανεξάρτητα δείγματα μιας συνεχούς τυχαίας μεταβλητής που ακολουθεί εκθετική κατανομή με παράμετρο λ=5. Στη συνέχεια, επιλέγουμε τον αριθμό των κλάσεων που επιθυμούμε, 50 κλάσεις ίσου πλάτους, και βρίσκουμε το πλάτος της κάθε κλάσης. Αυτό γίνεται διαιρώντας το δείγμα που έχει τη μεγαλύτερη τιμή με τον αριθμό των κλάσεων που έχουμε ορίσει.
Περίπτωση 1: 50 κλάσεις Περίπτωση 2: 100 κλάσεις
Ιστογράμματα συχνότητας εμφάνισης τυχαίας μεταβλητής Περίπτωση 1: 50 κλάσεις Η συχνότητα εξαρτάται από τον αριθμό των κλάσεων και από τον αριθμό των δειγμάτων. Tο ιστόγραμμα δε συγκλίνει στο PDF histogram. Περίπτωση 2: 100 κλάσεις
Ιστογράμματα PDF συνεχούς τυχαίας μεταβλητής Για να πάρουμε ιστόγραμμα που να περιγράφει την PDF (PDF histogram) της συνεχούς τυχαίας μεταβλητής πρέπει να προσθέσουμε την παρακάτω γραμμή στο πρόγραμμα, ώστε η απόλυτη συχνότητα της κάθε κλάσης να διαιρεθεί με το συνολικό αριθμό των δειγμάτων (number_of_samples) και το πλάτος των κλάσεων (width_of_class). Το width_of_class υπολογίζεται ως το πηλίκο της μέγιστης τιμής εμφάνισης της τυχαίας μεταβλητής (maximum_observation) και του επιθυμητού αριθμού κλάσεων (number_of_classes).
Σύγκλιση στο PDF histogram για αυξανόμενο αριθμό κλάσεων (I) λ = 5 samples/sec Samples: 100000 Κλάσεις: 50
Σύγκλιση στο PDF histogram για αυξανόμενο αριθμό κλάσεων (II) λ = 5 samples/sec Samples: 100000 Κλάσεις: 100
Σύγκλιση στο PDF histogram για αυξανόμενο αριθμό κλάσεων (III) λ = 5 samples/sec Samples: 100000 Κλάσεις: 500