ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ (Εργαστήριο) Εισηγητής: Θανάσης Βαφειάδης Α.Τ.Ε.Ι. ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΕΜΠΟΡΙΑΣ ΚΑΙ ΔΙΑΦΗΜΙΣΗΣ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ (Εργαστήριο) Εισηγητής: Θανάσης Βαφειάδης
ΕΡΓΑΣΤΗΡΙΟ #1
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Βασικές έννοιες της Περιγραφικής Στατιστικής (στατιστική μονάδα, μεταβλητή, κατηγορίες μεταβλητών, πολυδιάστατα δεδομένα, πίνακες). Πολυδιάστατη Στατιστική Ανάλυση – Μέθοδοι Ανάλυσης Δεδομένων. 2. Ερωτηματολόγιο - Κανόνες ορθής σύνταξης ερωτηματολογίου - Παραδείγματα. Κωδικοποίηση των μεταβλητών, χωρισμός σε κατηγορίες, δημιουργία αρχικού πίνακα δεδομένων (εισαγωγή δεδομένων, κωδικοποίηση των μεταβλητών με το λογισμικό M.A.D.) Διαζευκτικοί/Λογικοί πίνακες, Πίνακες συμπτώσεων, Πίνακες Burt (Δομή, Ιδιότητες, Διαδικασία κατασκευής). Κατασκευή των πινάκων με το M.A.D. 4. Εισαγωγή στην Παραγοντική Ανάλυση των Αντιστοιχιών (Πίνακες εισόδου, αλγόριθμος, αποτελέσματα). Παραγοντική Ανάλυση των Αντιστοιχιών με το M.A.D. Παραδείγματα. Εφαρμογή Μεθόδων Ανάλυσης Δεδομένων στην Έρευνα Αγοράς Εκπόνηση εργασίας (στατιστική έρευνα με ερωτηματολόγιο)
Βασικές έννοιες Περιγραφικής Στατιστικής ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 Βασικές έννοιες Περιγραφικής Στατιστικής Στατιστική μονάδα ή Αντικείμενο: είναι τα αντικείμενα από τα οποία λαμβάνουμε τις πληροφορίες που επιθυμούμε να επεξεργαστούμε και να αναλύσουμε στατιστικά. Η στατιστική μονάδα μπορεί να είναι αντικείμενο, άτομο, γεγονός ή ακόμη και έννοια. Χαρακτηριστικό ή τυχαία μεταβλητή: τα χαρακτηριστικά των στατιστικών μονάδων που θέλουμε να μελετήσουμε σε μία συγκεκριμένη περίπτωση, ονομάζονται μεταβλητές. Οι μεταβλητές διακρίνονται σε: 1.Ποιοτικές: θεωρούνται οι μεταβλητές που δεν μπορούν να εκφραστούν αριθμητικά αλλά διακρίνονται σε συγκεκριμένες κατηγορίες ή ομάδες που ονομάζονται διαβαθμίσεις ή κλάσεις ή ιδιότητες. Επομένως στις ποιοτικές μεταβλητές δεν υπάρχουν κλίμακες μέτρησης. π.χ. Η μεταβλητή ΦΥΛΟ με δύο διαβαθμίσεις 1. Άνδρας και 2. Γυναίκα. 2.Ποσοτικές: θεωρούνται οι μεταβλητές στις οποίες μπορούμε να αντιστοιχίσουμε έναν αριθμό μιας συγκεκριμένης κλίμακας. Τα στατιστικά δεδομένα αποτελούν στην περίπτωση αυτή μια σειρά αριθμητικών μετρήσεων. Π.χ. Η μεταβλητή ΗΛΙΚΙΑ με τιμές 18, 35, 67...
Μια ποσοτική μεταβλητή διακρίνεται σε: 1.Συνεχής 2.Ασυνεχής ή διακριτή ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 Μια ποσοτική μεταβλητή διακρίνεται σε: 1.Συνεχής 2.Ασυνεχής ή διακριτή Συνεχής: μια ποσοτική μεταβλητή θα ονομάζεται συνεχής όταν μπορεί να λάβει οποιαδήποτε τιμή μέσα σε ένα διάστημα πραγματικών αριθμών π.χ. Ηλικία, Βάρος, Ύψος. Ασυνεχής ή διακριτή: Όταν οι τιμές που αυτή μπορεί να λάβει είναι μεμονωμένες, δηλαδή υπάρχουν τιμές της μεταξύ των οποίων δεν είναι δυνατό να υπάρξει άλλη τιμή της. Π.χ. Αριθμός Παιδιών Οικογένειας, Μηνιαίες Πωλήσεις Αυτοκινήτων. Πολυδιάστατα δεδομένα: Το σύνολο των μεταβλητών ενός ορισμένου πλήθους αντικειμένων που αναφέρονται σε μια στατιστική μονάδα, ενός καθορισμένου πληθυσμού. Χ1 Χ2 .... Χn 1 2 . m Γενικά ένας πίνακας με πολυδιάστατα δεδομένα με m αντικείμενα και n μεταβλητές, έχει τη μορφή:
Μέθοδοι Στατιστικής Ανάλυσης Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 Πολυδιάστατη Στατιστική Ανάλυση: σύνολο μεθόδων της στατιστικής που αναπτύχθηκαν για τη διερεύνηση των σχέσεων ανάμεσα σε πολλές μεταβλητές. Στοχεύουν στην επαγωγική αναζήτηση νέων, κρυμμένων διαστάσεων που είναι δυνατό να ορισθούν ως συνδυασμοί των αρχικών μεταβλητών – διαστάσεων. Μέθοδοι Στατιστικής Ανάλυσης Δεδομένων Ανήκουν στις μεθόδους της Πολυδιάστατης Στατιστικής Ανάλυσης. Νέος κλάδος στατιστικών μεθόδων που αναπτύχθηκε μετά το 1960 και στηρίζεται στη χρήση ηλεκτρονικού υπολογιστή. Στη Γαλλία, κύριος εκφραστής της φιλοσοφίας των μεθόδων ο J.P. Benzècri. Σύνθεση μεθόδων της Περιγραφικής Στατιστικής, στηρίζονται στις αρχές της Γραμμικής Άλγεβρας. Με την εφαρμογή των μεθόδων της Ανάλυσης Δεδομένων, επιτυγχάνεται η διαστολή του φαινομένου, που περιγράφει ο πίνακας των αριθμητικών δεδομένων που αναλύεται και το αποτέλεσμα – προϊόν της ανάλυσης παρουσιάζεται υπό μορφή εικόνας, φωτογραφίας ή ακτινογραφίας του διασταλμένου φαινομένου. Επιτρέπεται μ’ αυτόν τον τρόπο να αναδυθούν και να αναδειχθούν οι κρυμμένες και μη ιδιότητες των μεταβλητών χωρίς καμία a priori υπόθεση.
ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 Η μέθοδος που θα διδαχτεί ανήκει στο πλαίσιο της Γαλλικής Σχολής Ανάλυσης Δεδομένων και είναι η: Παραγοντική Ανάλυση των Αντιστοιχιών: αναδεικνύονται οι φανερές και κρυφές αλληλεξαρτήσεις των δεδομένων και αποκαλύπτεται η δομή τους μέσα από την ερμηνεία των παραγοντικών αξόνων και των παραγοντικών επιπέδων. Παράδειγμα #1 Μια καπνοβιομηχανία επιθυμεί να προωθήσει στην αγορά μια νέα μάρκα τσιγάρων. Πριν προχωρήσει σε αυτό, κρίνει σκόπιμο να μελετήσει το κατά πόσο επηρεάζονται οι πωλήσεις τσιγάρων από την ηλικία, το φύλο, την οικογενειακή κατάσταση και τις προτιμήσεις των καπνιστών. Αποφασίζει για το σκοπό αυτό, να διεξάγει έρευνα με ερωτηματολόγιο και να χρησιμοποιήσει για την επεξεργασία των δεδομένων και την εξαγωγή συμπερασμάτων, τις δύο παραπάνω μεθόδους Στατιστικής Ανάλυσης Δεδομένων.
ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ - Εργαστήριο #1 Παράδειγμα #2 Στο πλαίσιο του μαθήματος «Ανάλυση Δεδομένων», ένας σπουδαστής πραγματοποίησε έρευνα με ερωτηματολόγιο με σκοπό να διαπιστωθούν οι τάσεις που παρουσιάζουν οι σπουδαστές του τμήματος Εμπορίας και Διαφήμισης στην κατανάλωση φρέσκου γάλακτος, να εντοπιστούν οι χώροι προμήθειας αυτού και να διερευνηθεί ο ρόλος του φρέσκου γάλακτος στην καθημερινότητά τους. Η στατιστική επεξεργασία έγινε με το λογισμικό M.A.D. και η εξαγωγή συμπερασμάτων με τη βοήθεια των μεθόδων ανάλυσης δεδομένων (παραγοντική ανάλυση των αντιστοιχιών, ανιούσα ιεραρχική ταξινόμηση).