Κατανομή δειγματοληψίας διαφοράς δύο μέσων δειγμάτων Έστω δύο άπειροι πληθυσμοί, οι οποίοι έχουν – μέσους μ 1 και μ 2 και – Τυπικές αποκλίσεις σ 1 και σ 2 Αν πάρουμε όλα τα δυνατά ζεύγη δειγμάτων n 1, n 2, – και από κάθε ζεύγος δείγματος υπολογίσουμε τους μέσους – στη συνέχεια πάρουμε τη διαφορά τους, τότε θα προκύψουν τόσες διαφορές όσα και τα ζεύγη των δειγμάτων.
Κατανομή δειγματοληψίας διαφοράς δύο μέσων δειγμάτων 2. Η μέση τιμή των διαφορών συμπίπτει με τη διαφορά των μέσων μ 1 - μ 2 των πληθυσμών από τους οποίους έχουν ληφθεί τα δείγματα.
3. Η διακύμανση της κατανομής δειγματοληψίας της διαφοράς των μέσων των δύο δειγμάτων υπολογίζονται ως εξής: α) Αν οι διακυμάνσεις σ 1 2 και σ 2 2 των πληθυσμών είναι γνωστές, τότε η διακύμανση είναι: β) Αν οι διακυμάνσεις σ 1 2 και σ 2 2 των πληθυσμών είναι άγνωστες, τότε τις αντικαθιστούμεμε τις αμερόληπτες εκτιμήσεις S 1 2 και S 2 2 των δειγμάτων, οπότε :
γ. Αν τα δείγματα προέρχονται από τον ίδιο πληθυσμό ή από όμοιους πληθυσμούς τότε έχουν την ίδια διακύμανση – Αν δεν την έχουμε διαθέσιμη την εκτιμούμε με τον τύπο Η διακύμανση της κατανομής δειγματοληψίας των μέσων των δειγμάτων θα είναι
Διάστημα εμπιστοσύνης διαφοράς δύο μέσων αριθμητικών όταν τα δείγματα είναι μεγάλα n 1, n 2 >30 και οι διακυμάνσεις είναι γνωστές Το διάστημα εμπιστοσύνης εντός του οποίου αναμένεται ότι θα βρίσκεται η διαφορά μ 1 – μ 2 με πιθανότητα ή επίπεδο εμπιστοσύνης 1 - α είναι:
Έστω δείγμα n 1 =150 με μέση τιμή και δείγμα n 2 =200 με μέση τιμή. Αν οι τυπικές αποκλίσεις του πληθυσμού είναι γνωστές και ίσες με σ 1 =120 και σ 2 =80 να βρεθεί ένα διάστημα εμπιστοσύνης 95 % για την διαφορά των μέσων των αντίστοιχων πληθυσμών. α=0,05 α/2=0,025 => 1-0,025=0,975 Ζ α/2 =1,96 Ο μέσος μ 1 υπερέχει του μ 2 τουλάχιστον 177,83 μονάδες
Ζ0,000,010,020,030,040,050,060,070,080,09 0,00,50000,50400,50800,51200,51600,51990,52390,52790,53190,5359 0,10,5398 0,54380,54780,55170,55570,55960,56360,56750,57140,5753 0,20,5793 0,58320,58710,59100,59480,59870,60260,60640,61030,6141 0,30,6179 0,62170,62550,62930,63310,63680,64060,64430,64800,6517 0,40,6554 0,65910,66280,66640,67000,67360,67720,68080,68440,6879 0,50,6915 0,6950 0,69850,70190,70540,70880,71230,71570,71900,7224 0,60,72570,72910,73240,73570,73890,74220,74540,74860,75170,7549 0,70,75800,76110,76420,76730,77040,77340,77640,77940,78230,7852 0,80,78810,79100,79390,79670,79950,80230,80510,80780,81060,8133 0,90,81590,81860,82120,82380,82640,82890,83150,83400,83650,8389 1,00,84130,84380,84610,84850,85080,85310,85540,85770,85990,8621
Ζ0,000,010,020,030,040,050,060,070,080,09 1,10,86430,86650,86860,87080,87290,87490,87700,87900,88100,8830 1,20,88490,88690,88880,89070,89250,89440,89620,89800,89970,9015 1,30,90320,90490,90660,90820,90990,91150,91310,91470,91620,9177 1,40,91920,92070,92220,92360,92510,92650,92790,92920,93060,9319 1,50,93320,93450,93570,93700,93820,93940,94060,94180,94290,9441 1,60,94520,94630,94740,94840,94950,95050,95150,95250,95350,9545 1,70,95540,95640,95730,95820,95910,95990,96080,96160,96250,9633 1,80,96410,96490,96560,96640,96710,96780,96860,96930,96990,9706 1,90,97130,97190,97260,97320,97380,97440,97500,97560,97610,9767 2,00,97720,97780,97830,97880,97930,97980,98030,98080,98120,9817 2,10,98210,98260,98300,98340,98380,98420,98460,98500,98540,9857
θεωρούμε ηλεκτρικούς λαμπτήρες δυο διαφορετικών κατασκευαστών Α και Β. Παίρνουμε για το σκοπό αυτό 100 λαμπτήρες από κάθε κατασκευαστή. Βρίσκουμε ότι το δείγμα των λαμπτήρων του κατασκευαστή Α έχει μέση διάρκεια ζωής 1020 ώρες και τυπική απόκλιση 90 ώρες, το δείγμα λαμπτήρων του κατασκευαστή Β έχει μέση διάρκεια ζωής 980 ώρες και τυπική απόκλιση 100 ώρες. Να βρεθεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων των πληθυσμών. α=0,10 α/2=0,05 => 1-α/2=1-0,05=0,995 Ζ α/2 =1,645
X 1 : 1, 2, 3 X 2 : 3, 5, 4 Με την υπόθεση ότι τα δείγματα προέρχονται από κανονικούς πληθυσμούς να βρεθεί ένα διάστημα εμπιστοσύνης 95 % για την διαφορά των μέσων του πληθυσμού. Βαθμοί Ελευθερίας = n 1 +n 2 =3+3=6
X Σύνολο 2
X Σύνολο 2
Επίπεδο εμπιστοσύνης0,8000,9000,9500,9800,990 Μονόπλευρος0,10000,05000,02500,01000,0050 Δίπλευρος0,20000,10000,05000,02000, ,5332,1322,7763,7474,604 51,4762,0152,5713,3654,032 61,4401,9432,4473,1433,707
Υποθέτουμε ότι τα δείγματα προέρχονται από όμοιους πληθυσμούς και συνεπώς έχουν την ίδια διακύμανση. – Αν δεν την έχουμε διαθέσιμη την εκτιμούμε με τον τύπο Η διακύμανση της κατανομής δειγματοληψίας των μέσων των δειγμάτων θα είναι
Με βάση τα στοιχεία του πιο κάτω πίνακα για δυο τυχαία δείγματα από δυο πληθυσμούς να υπολογιστεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων του πληθυσμού. Υποθέτουμε ότι οι πληθυσμοί είναι όμοιοι
Με βάση τα στοιχεία του πιο κάτω πίνακα για δυο τυχαία δείγματα από δυο πληθυσμούς να υπολογιστούν Να βρεθεί ένα διάστημα εμπιστοσύνης 90 % για την διαφορά των μέσων του πληθυσμού. t n1+n2-2 =t 20 =1,725 Επίπεδο εμπιστοσύνης0,8000,9000,9500,980 Μονόπλευρος0,10000,05000,02500,0100 Δίπλευρος0,20000,10000,05000, ,3281,7292,0932, ,3251,7252,0862,528
Σταθμισμένη διασπορά (pooled variance) Χρησιμοποιείται γιατί έχουμε δύο ανεξάρτητες εκτιμήσεις που προέρχονται από δύο διαφορετικά δείγματα για την ίδια ποσότητα το σ 2. Κάνουμε χρήση και των δύο αυτών εκτιμήσεων λαμβάνοντας δίνοντας όμως την αντίστοιχη βαρύτητα – μέγεθος της καθεμιάς.