Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Διάλεξη 1 Βασικές έννοιες 4/10/2017 Στατιστική IΙ (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: lzabetak@dpem.tuc.gr Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/Psycho/Zampetakis/ Τηλ. 28210 – 37323 Διάλεξη 1 Βασικές έννοιες Ρέθυμνο, 12-10-2009
Στις διαλέξεις συμμετέχουν οι: ΜΠΑΜΠΗΣ ΑΠΟΣΤΟΛΗΣ ΛΕΩΝΙΔΑΣ
Σημαντική Υπενθύμιση: 4/10/2017 Σημαντική Υπενθύμιση: Δεν υπάρχουν χαζές ερωτήσεις και δεν θα με προσβάλετε αν διακόπτετε με ρωτήσεις το μάθημα
Βαθμολογία: 3 ατομικές εργασίες: 30% τελικού βαθμού Τελική εξέταση : 4/10/2017 Βαθμολογία: 3 ατομικές εργασίες: 30% τελικού βαθμού Τελική εξέταση : 70% τελικού βαθμού 100%
4/10/2017
Προσοχή: Η παράδοση των εργασιών θα γίνεται μόνο μέσω email >στο 4/10/2017 Προσοχή: Η παράδοση των εργασιών θα γίνεται μόνο μέσω email >στο lzabetak@dpem.tuc.gr Στο email πρέπει να γράφετε στο θέμα τα εξής: ΨΥΧ221-Εγασία Νο και το ονοματεπώνυμο σας
…Για να θυμηθούμε μερικά βασικές έννοιες 4/10/2017 …Για να θυμηθούμε μερικά βασικές έννοιες 1. Τι είναι η Στατιστική? 2. Τυχαία Δειγματοληψία? 3. Μεταβλητές? 4. Η βασική μαθηματική εξίσωση της στατιστικής? 5. Δείκτες κεντρικής Τάσης? 6. Δείκτες διασποράς? 7. Κλίμακες μέτρησης? 8. Κανονική κατανομή?
9. Τυπική κανονική κατανομή? 4/10/2017 9. Τυπική κανονική κατανομή? 10. Στατιστική σημαντικότητα? 11. Έλεγχος υποθέσεων? 4. Η βασική μαθηματική εξίσωση της στατιστικής? 5. Δείκτες κεντρικής Τάσης? 6. Δείκτες διασποράς? 7. Κλίμακες μέτρησης? 8. Κανονική κατανομή?
Definitions: Oxford English Dictionary Τι είναι Στατιστική; Στατιστική είναι ένας τρόπος με τον οποίο αντλούμε πληροφορίες από δεδομένα. Στατιστική Δεδομένα Πληροφορίες Δεδομένα: Γεγονότα, κυρίως αριθμητικά, συλλεγμένα για αναφορά ή πληροφορία. Πληροφορία: Γνώση αναφερόμενη για κάποιο συγκεκριμένο γεγονός. Στατιστική είναι ένα εργαλείο για να δημιουργήσουμε μία νέα αντίληψη από ένα σύνολο αριθμών. ΔΕΔΟΜΕΝΑ =210895496 >>>ΠΛΗΡΟΦΟΡΙΑ 210-895 496 Definitions: Oxford English Dictionary
4/10/2017
Τυχαία (random sampling) ονομάζεται η δειγματοληψία κατά την οποία κάθε μέλος του πληθυσμού έχει την ίδια πιθανότητα, με τα υπόλοιπα μέλη, να επιλεχθεί στο δείγμα. Μη τυχαία (non random sampling) ονομάζεται η δειγματοληψία κατά την οποία ορισμένα άτομα έχουν μεγαλύτερη (αλλά άγνωστη) πιθανότητα να επιλεγούν στο δείγμα. Η τυχαία δειγματοληψία, αυξάνει την εγκυρότητα των αποτελεσμάτων της έρευνας μας
4/10/2017 ΜΕΤΑΒΛΗΤΕΣ Κάθε τι (αντικείμενο ή κατάσταση) που επιδέχεται περισσότερες από μια τιμές. Οι τιμές αυτές δεν χρειάζεται να είναι κατ’ ανάγκη αριθμητικές. Για παράδειγμα: Το βάρος, το ύψος, το φύλο, μάρκες αυτοκινήτων, η δημιουργικότητα, η συναισθηματική νοημοσύνη Στην ψυχολογία πολλές μεταβλητές δεν μπορούμε να τις μετρήσουμε απευθείας (πχ νοημοσύνη) και χρησιμοποιήσουμε διάφορες τεχνικές και έμμεσους τρόπους (πχ ερωτηματολόγια αυτό-αναφοράς) για να τις εκτιμήσουμε.
Βασική μαθηματική εξίσωση: 4/10/2017 Βασική μαθηματική εξίσωση: Αποτέλεσμα = (Μοντέλο) + Λάθος
4/10/2017 O Μέσος όρος, η Δεσπόζουσα τιμή (mode), και η Διάμεσος (median) ανήκουν στους λεγόμενους δείκτες κεντρικής τάσης (central tendency measures) και χρησιμοποιούνται για να δείξουν το κέντρο μιας σειράς δεδομένων (κατανομής). Η Τυπική απόκλιση, το Ενδοτεταρτημοριακό εύρος (interquartile range) και το Εύρος (range) και ανήκουν στους λεγόμενους δείκτες διασποράς και χρησιμοποιούνται για να δείξουν τη διακύμανση των τιμών μιας σειράς δεδομένων (κατανομής).
Ο μέσος όρος ως παράδειγμα ενός απλού στατιστικού μοντέλου 4/10/2017 Ο μέσος όρος ως παράδειγμα ενός απλού στατιστικού μοντέλου Ο μέσος όρος είναι στην ουσία ένα απλό μοντέλο. Αποτελεί μια σύνοψη των δεδομένων μας. Είναι μια υποθετική τιμή, η οποία μπορεί να υπολογιστεί για κάθε σύνολο δεδομένων αλλά δεν είναι απαραίτητο να υπάρχει στα δεδομένα μας. Για παράδειγμα υποθέστε ότι ρωτάμε 5 φοιτητές να μας πουν τον αριθμό των «κολλητών» που έχουν. Τα δεδομένα μας μπορεί να είναι ως εξής: 1, 2, 3, 3 και 4. Στην περίπτωση αυτή ο Μ.Ο = (1+2+3+3+4)/5 = 2,6 Είναι μάλλον αδύνατο να έχουμε 2,6 φίλους. Επομένως η τιμή του Μ.Ο. είναι μια υποθετική τιμή. Υπό την έννοια αυτή ο Μ.Ο. αποτελεί ένα μοντέλο που κατασκευάσαμε προκειμένου να περιγράψουμε κατά τρόπο συνοπτικό τα δεδομένα μας.
4/10/2017 Η τυπική απόκλιση είναι ένα μέτρο του πόσο καλή είναι η προσαρμογή του μέσου όρου στα δεδομένα. Μικρές τιμές (σε σχέση με το μ.ο. ) δείχνουν ότι τα δεδομένα μας είναι κοντά στο μ.ο. Μεγάλες τιμές της τυπικής απόκλισης (σε σχέση με το μ.ο.) δείχνουν ότι τα δεδομένα μας βρίσκονται μακριά από το μ.ο. ή αλλιώς ότι ο μ.ο. δεν αναπαριστά με ακρίβεια τα δεδομένα μας.
(ή ποσό αντιπροσωπευτικό είναι το δείγμα μας ) 4/10/2017 Το τυπικό σφάλμα (standard error) (ή ποσό αντιπροσωπευτικό είναι το δείγμα μας ) Από τα προηγούμενα μαθήματα γνωρίζουμε ότι στην ψυχολογία παίρνουμε τυχαία δείγματα από κάποιον πληθυσμό (στον οποίο δεν έχουμε πρόσβαση) για να εξηγήσουμε φαινόμενα σε επίπεδο πληθυσμού. Είδαμε ότι μπορούμε να περιγράψουμε το δείγμα μας με το μ.ο. και με την τυπική απόκλιση εξετάζουμε την προσαρμογή του μ.ο. στα δεδομένα του δείγματος. Γνωρίσουμε επίσης ότι κάθε δείγμα που παίρνουμε από τον πληθυσμό μας είναι ένα από τα άπειρα δείγματα που μπορούμε να πάρουμε (θυμηθείτε τη δειγματοληπτική κατανομή) Το τυπικό σφάλμα είναι η τυπική απόκλιση της δειγματοληπτικής κατανομής (που είδαμε στο προηγούμενο μάθημα) και μας δίνει μια εκτίμηση του πόσο αντιπροσωπευτικό είναι το δείγμα μας.
4/10/2017
Χαρακτηριστικά της Κανονικής Κατατομής (ΚΤ) 4/10/2017 Χαρακτηριστικά της Κανονικής Κατατομής (ΚΤ) 1. Έχει κωδωνοειδές σχήμα (καμπάνας) και η καμπύλη είναι ασυμπτωτική (asymptotic) προς τον οριζόντιο άξονα, δηλ. θεωρητικά δεν αγγίζει ποτέ τον οριζόντιο άξονα, αλλά προεκτείνεται και προς τις δύο κατευθύνσεις προς το άπειρο 2. Είναι συμμετρική γύρω από το μέσο όρο 3. Ο ΜΟ, η Δμ και η Δστ είναι ίσες 4. Μπορούμε εύκολα να την προσδιορίσουμε από το ΜΟ και την τυπική απόκλιση (ΤΑ) 5. Η επιφάνεια κάτω από τη γραμμή είναι ανάλογη της σχετικής συχνότητας των παρατηρήσεων μας
4/10/2017 Είδαμε ότι το σχήμα της κανονικής κατανομής επηρεάζεται από την τυπική απόκλιση. Υπάρχει όμως μια ΚΤ η οποία ονομάζεται τυπική κανονική κατανομή (standard normal distribution), η οποία έχει μέσο όρο μηδέν και τυπική απόκλιση ίση με τη μονάδα Ν(0,1). Την τυπική κανονική κατανομή μπορούμε να τη χρησιμοποιήσουμε για να υπολογίσουμε το πόσο πιθανή είναι μια συγκεκριμένη τιμή της μεταβλητής μας (πχ. Αν βρούμε ότι η τιμή μιας μεταβλητής είναι μεγαλύτερη από το 2 (στην τυπική κανονική κατανομή) τότε ξέρουμε ότι η τιμή αυτή έχει πολύ μικρή πιθανότητα να παρατηρηθεί αφού το 95% των τιμών βρίσκονται στο ±2)
ΓΙΑΤΙ είναι χρήσιμες οι τυπικές τιμές 4/10/2017 ΓΙΑΤΙ είναι χρήσιμες οι τυπικές τιμές Αυτό που μας προσφέρουν οι τυπικές τιμές είναι δύο πράγματα: Ένα σημείο αναφοράς ως προς το μέσο όρο Τη δυνατότητα να συγκλίνουμε τιμές από διαφορετικά δείγματα Πχ Έστω ένα δείγμα 300 ατόμων για τα οποία μετράμε την ΕQ. Τι συμπέρασμα θα βγάζαμε αν για ένα άτομο η EQ είναι 125? Αν όμως το άτομο αυτό έχει ένα z score=3, τότε ξέρουμε ότι είναι έχουμε άτομο με ιδιαιτέρα υψηλή EQ
Η τιμή p (p value), Επίπεδο στατιστικής σημαντικότητας 4/10/2017 Επίπεδο στατιστικής σημαντικότητας (significance level – alpha). Το ορίζει ο ερευνητής και συνήθως είναι 0,05 ή 0,001 δηλαδή η πιθανότητα να πάρουμε τη συγκεκριμένη τιμή στο στατιστικό δείκτη εξαιτίας τυχαίων παραγόντων είναι μόλις 5% και 1% αντίστοιχα. Και οι δύο χρησιμοποιούνται στον έλεγχο υποθέσεων Η τιμή p (p value), ενός στατιστικού τεστ είναι η πιθανότητα να παρατηρήσουμε ένα στατιστικό τεστ τουλάχιστον τόσο ακραίο όσο η υπολογισμένη, δοθέντος ότι η μηδενική υπόθεση είναι αληθής.
Στατιστικός έλεγχος υποθέσεων 4/10/2017 Στατιστικός έλεγχος υποθέσεων Αντιλαμβάνεστε ότι η στατιστική υπόθεση είναι στην ουσία ένας ισχυρισμός που κάνουμε για μια παράμετρο στον πληθυσμό μας (πχ μέσος όρος ή συσχέτιση). Διατυπώνουμε δύο εναλλακτικές: Μηδενική Υπόθεση-Ηο: συνήθως ένας ουδέτερος ισχυρισμός Εναλλακτική Υπόθεση-Η1: μονής (one tailed) ή διπλής (two tailed) κατεύθυνσης πχ. η παρακολούθηση τηλεόρασης σχετίζεται με την κατάθλιψη? (διπλής κατεύθυνσης) Έστω μΥ η μέση μεταβολή στην κατάθλιψη μετά από παρακολούθηση τηλεόρασης Ηο:μΥ=0 >>>>η παρακολούθηση τηλεόρασης ΔΕΝ σχετίζεται με την κατάθλιψη >>>>η παρακολούθηση τηλεόρασης σχετίζεται με την κατάθλιψη
Συνοψίζοντας για τον έλεγχο υποθέσεων 4/10/2017 Συνοψίζοντας για τον έλεγχο υποθέσεων Κάθε φορά που επιθυμούμε να προσδιορίσουμε μια συσχέτιση, η μια διαφορά, στο δείγμα μας (ή σε διαφορετικά δείγματα), χρησιμοποιούμε ένα κατάλληλο στατιστικό κριτήριο (πχ το δείκτη συσχέτισης, ή το t-test) To στατιστικό κριτήριο που χρησιμοποιούμε έχει εκ των προτέρων γνωστές ιδιότητες (ιδιαιτέρα η κατανομή συχνοτήτων του) Αφού γνωρίζουμε την κατανομή του, μπορούμε να εκτιμήσουμε την πιθανότητα να λάβει το στατιστικό κριτήριο, την τιμή που έλαβε Εφόσον η πιθανότητα να λάβει το στατιστικό κριτήριο την τιμή που έλαβε είναι μικρότερη από το επίπεδο στατιστικής σημαντικότητας που έχουμε ορίσει (συνήθως 0,05) τότε δεχόμαστε την εναλλακτική υπόθεση. Empowerment: Giving employees responsibility for what they do Behaving ethically: Ethics is the study of moral values or principles that guide our behaviour and informs us whether actions are right or wrong 1. In a recent Financial Post survey, 75 percent of the public said it was extremely important for managers to make employees happy and satisfied. 2. Employees are increasingly demanding job satisfaction out of their jobs. In a recent Financial Post survey, 75 percent of the public deemed it extremely important for managers to make employees happy and satisfied. 3. Managers are empowering employees. They are putting employees in charge of what they do. And, in the process, managers are learning how to give up control, and employees are learning how to take responsibility for their work and make appropriate decisions. 4. In addition to the more obvious groups—women, First Nations peoples, Asian Canadians, African Canadians, Indo-Canadians—the workplace also includes people with disabilities, gays and lesbians, and the elderly.
4/10/2017 Σφάλμα Τύπου Ι (Τype I error) συμβαίνει όταν απορρίπτουμε μία αληθής μηδενική υπόθεση (δηλ βρίσκουμε κάτι το οποίο στην ουσία δεν υπάρχει- Σφάλμα τύπου Ι συμβαίνει όταν ο δικαστής καταδικάσει κάποιον αθώο), α είναι η πιθανότητα να κάνουμε σφάλμα τύπου Ι Σφάλμα Τύπου ΙΙ (Type II error) συμβαίνει όταν δεχόμαστε τη μηδενική υπόθεση ενώ δεν είναι αληθινή (δηλ. δεν βρίσκουμε κάποια ένδειξη ενώ υπάρχει>> ένοχος κατηγορούμενος αθωώνεται), β είναι η πιθανότητα να κάνουμε σφάλμα τύπου ΙΙ Ισχύς (power) = η ικανότητα του κριτηρίου να απορρίπτει μια ψευδή μηδενική υπόθεση δηλ. να βρούμε μια ένδειξη εκέι που πραγματικά υπάρχει. Ισχύς=1-β. Empowerment: Giving employees responsibility for what they do Behaving ethically: Ethics is the study of moral values or principles that guide our behaviour and informs us whether actions are right or wrong 1. In a recent Financial Post survey, 75 percent of the public said it was extremely important for managers to make employees happy and satisfied. 2. Employees are increasingly demanding job satisfaction out of their jobs. In a recent Financial Post survey, 75 percent of the public deemed it extremely important for managers to make employees happy and satisfied. 3. Managers are empowering employees. They are putting employees in charge of what they do. And, in the process, managers are learning how to give up control, and employees are learning how to take responsibility for their work and make appropriate decisions. 4. In addition to the more obvious groups—women, First Nations peoples, Asian Canadians, African Canadians, Indo-Canadians—the workplace also includes people with disabilities, gays and lesbians, and the elderly.
Ο Ρόλος των Η/Υ στην στατιστική 4/10/2017 Ο Ρόλος των Η/Υ στην στατιστική Στατιστικά πακέτα:
4/10/2017 Προσεχώς... Δευτέρα 19-10-2009 Συσχέτιση, effect size (μέγεθος αποτελέσματος) και έλεγχος κανονικής κατανομής
4/10/2017 Σας ευχαριστώ...