האם ניתן להגדיל את עוצמת המבחן? גודל המדגם (ככל שהמדגם גדל, כך העוצמה גדלה). סטיית התקן של האוכלוסייה (ככל ש- קטנה, כך העוצמה גדלה). רמת המובהקות (ככל ש- קטנה, כך העוצמה קטנה). המרחק בין 0 ל-1 (ככל שהמרחק גדל, כך העוצמה גדלה). הגדלת גודל המדגם!
עוצמה ו-n מינימלי חברת תרופות מפתחת תרופה חדשה להורדת לחץ דם בחולים הסובלים מיתר לחץ דם. מנכ"ל החברה טוען שאם התרופה לא תוריד את לחץ הדם (הסיסטולי) בלפחות 5 יחידות, לא שווה לו הפיתוח. צוות החוקרים פיתח תרופה ומתכוונן לבדוק אותה במדגם של 30 חולים. אם ידוע שלחץ הדם הסיסטולי בקרב חולים הסובלים מיתר לחץ דם הוא בממוצע 180 עם סטיית תקן של 20, מה תהיה לכל הפחות עוצמת המבחן אם החוקרים משתמשים ברמת מובהקות של 0.05? 173.99 175 180 הנחות: התפלגות הדגימה נורמלית, דגימה מקרית
מהו מספר החולים שעל החוקרים לדגום ע"מ לעמוד בדרישה זו? החוקר פנה בבקשה לביצוע הניסוי, לארגון פיתוח התרופות האירופאי. תשובתם הייתה שהם לא מאפשרים ניסויים שעוצמתם הסטטיסטית קטנה מ-0.9. מהו מספר החולים שעל החוקרים לדגום ע"מ לעמוד בדרישה זו? NORMSINV(0.9)=1.28
n מינימלי ערך קריטי ערך z שמעליו p=0.1 באופן כללי:
רווח בר סמך לממוצע האוכלוסייה Confidence interval (C.I.) זהו מעבר מאומדן נקודתי לטווח. עבור כל משתנה המתפלג נורמלית ניתן לומר ש: 1- = ערך ה-z שהשטח שמעליו הוא p=0.025 p=0.025 לדוגמה: p=0.95 z=-1.96 z=1.96
אם: ובונים התפלגות דגימה של ממוצעים עבור n גדול מספיק אזי: כאשר אם בכל התפלגות נורמלית ניתן לומר ש: אזי בפרט בהתפלגות דגימה של ממוצעים: אם נבודד את נמצא ש:
מכאן ש: אם דוגמים מדגם בודד בגודל n מאוכלוסייה מסוימת, ניתן לדעת מהו הטווח ברמת בטחון רצויה (1-) של ממוצע () האוכלוסייה ממנה הוא נלקח. דוגמא: ידוע שסטיית התקן של רמת ההכנסה באוכלוסייה הינה 0=300. במדגם בגודל n=30 נמצא שההכנסה הממוצעת היתה 4000 ₪. ברמת בטחון של 95% ((=0.05, מהו ממוצע ההכנסה של כלל האוכלוסייה? applet
דוגמא 0 (לא ידוע) =1 n=5
גודל הרווח שווה ל: מכאן ש: אם רוצים גודל רווח מסוים ברמת בטחון נתונה, ניתן לקבוע את גודל המדגם המינימלי הדרוש.
קיבלנו רווח בגודל: מהו גודל המדגם המינימלי על מנת שגודל הרווח יהיה לכל היותר 500? ה-n המינימלי הוא 554 (מעגלים תמיד כלפי מעלה).
מהו הקשר שבין רווח בר סמך לבדיקת השערות? רב"ס אזור אי הדחייה: אבל כל ימצא באיזור אי הדחייה של מספר התפלגויות (H0 אפשריים), זהו בדיוק הרב"ס של הממוצע.
מהו הקשר שבין רווח בר סמך לבדיקת השערות? כל ערכי ה- שאילו היינו שמים אותם ב-H0, לא היינו דוחים בהשערה דו-צדדית עבור אותה רמת בטחון הרווח בר סמך מכיל את כל ערכי ה- שאילו היינו שמים אותם ב- לא היינו דוחים אותה.
מבחן z (ואחיו שנלמד בהמשך: מבחן t) הוא הבסיס למשפחת הסטטיסטיקה הפרמטרית: ניתוח שונות רגרסיה זו הסטטיסטיקה הרווחת בשוק. דרישות: משתנים בסולם רווח/יחס (מבוססת על ממוצעים) התפלגות דגימה נורמלית ועוד כמה שנלמד בסמסטר הבא למרות שרב המשתנים במדעי החברה לא עונים לדרישות אלו, הסטטיסטיקה הרווחת היא פרמטרית.
דגימה מקרית: כל המבחנים הסטטיסטיים מבוססים על דגימה מקרית. דגימה שבה לכל פרט באוכלוסייה יש סיכוי זהה להיכלל במדגם. זו הנחה שכמובן לרב לא מתקיימת. אי קיומה פוגעת גם ביכולת ההכללה של הממצאים (תוקף חיצוני). לכל מחקר ארבעה סוגי תוקף עיקריים: תוקף מבנה - עד כמה ההגדרה האופרציונלית של המשתנים תואמת את ההגדרה התיאורטית. תוקף פנימי - האם המשתנה הבלתי תלוי הוא הסיבה למשתנה התלוי או שמא ישנם משתנים חיצוניים המתערבים במחקר. תוקף המסקנה הסטטיסטית - עוצמת המבחן, טעות מסוג I, בחירת המבחן הסטטיסטי. תוקף חיצוני - יכולת הכללה של הממצאים (דגימה מייצגת)
(10 נק') ידוע כי אצל חולות סכיזופרניה הגיל בו פורצת המחלה מתפלג נורמלית עם ממוצע 25, וסטיית תקן 3. חוקרת טוענת, כי אצל נשים חולות סכיזופרניה אשר בנוסף לכך הינן ג'ינג'יות, הגיל הממוצע לפריצת המחלה שונה. לשם בדיקת טענתה, ערכה מחקר ובו דגמה מקרית 36 חולות סכיזופרניה ג'ינג'יות, ובדקה את הגיל בו פורצת המחלה אצלן ומצאה כי הוא 24. בדקי האם החוקרת צודקת בטענתה ברמת ביטחון של 95% ? אילו לחוקרת היתה השערה כי המחלה פורצת בגיל מוקדם יותר לפני ביצוע המחקר, האם היא היתה מגיעה למסקנה דומה/שונה מזו אליה הגיעה בסעיף א'? עני ללא חישוב. מהי עוצמת המבחן שביצעת בסעיף א', אם אמנם ידוע כי הגיל הממוצע בו פורצת המחלה אצל אוכלוסיית הסכיזופרניות הגי'נג'יות, שווה לערך של האחוזון ה-33 באוכלוסיית הסכיזופרניות הכללית? מהו גודל המדגם המינימלי הדרוש ע"מ לעלות את העוצמה שחישבת בסעיף ג ל-90%? ללא קשר בסעיף ג', בהסתמך על נתוני המדגם וברמת בטחון של 95% מהו הגיל הממוצע בו פורצת המחלה באוכלוסיית הסכיזופרניות הגי'נג'יות?
א) עלינו לבדוק את השערת החוקרת ברמת ביטחון של 95%, הואיל וידועה ס"ת באוכלוסיה נבצע מבחן Z. הנחות: א. דגימה מקרית ב. התפלגות הדגימה נורמלית (המשתנה מתפלג נורמלית באוכלוסיה). השערות מבחן דו-זנבי: קביעת רמת מובהקות: 0.05 =α בדיקה: החלטה: H0 נדחית. ברמת ביטחון של 95% ניתן לומר כי גיל פריצת המחלה בקרב סכיזופרניות ג'ינג'יות שונה מזה של האוכלוסייה הכללית, והוא נמוך יותר.
ב) אילו לחוקרת היתה השערה כי המחלה פורצת בגיל מוקדם יותר לפני ביצוע המחקר, האם היא היתה מגיעה למסקנה דומה/שונה מזו אליה הגיעה בסעיף א'? עני ללא חישוב. החוקרת הייתה מגיעה למסקנה דומה. אילו לחוקרת היה בסיס תיאורטי כדי להניח השערה חד-זנבית, איזור הדחייה בצד השלילי של התפלגות הדגימה היה 0.05 ולא 0.025. בהינתן אותו ממוצע מדגם החוקרת הייתה דוחה את השערת האפס.
ג) מהי עוצמת המבחן שביצעת בסעיף א', אם אמנם ידוע כי הגיל הממוצע בו פורצת המחלה אצל אוכלוסיית הסכיזופרניות הגי'נג'יות, שווה לערך של האחוזון ה-33 באוכלוסיית הסכיזופרניות הכללית? כדי למצוא את עוצמת המבחן עלינו ראשית לדעת למה שווה . נתון כי ערך זה שווה לערך של האחוזון ה-33 באוכלוסיית הסכיזופרניות הכללית. הואיל וגיל פריצת המחלה מתפלג נורמאלית באוכלוסייה, אנחנו יודעים שציון התקן המתאים לערך זה הוא 0.44-. (מצאנו את ציון התקן מטבלת Z, ציון התקן שעד אליו יש 33 אחוז מההתפלגות, והוא כמובן שלילי). מכאן ש: אחרי שמצאנו את אנחנו יכולים להמשיך ולחשב עוצמת מבחן בדרך הרגילה –
1. חישוב לפי תחת : 2. מציאת ציון התקן שמתאים ל תחת : 3. חישוב עוצמת המבחן באמצעות לפי טבלת Z: עוצמת המבחן היא 75.17%.
ד) מהו גודל המדגם המינימלי הדרוש ע"מ לעלות את העוצמה שחישבת בסעיף ג ל-90%?
ה) ללא קשר בסעיף ג', בהסתמך על נתוני המדגם וברמת בטחון של 95% מהו הגיל הממוצע בו פורצת המחלה באוכלוסיית הסכיזופרניות הגי'נג'יות? עלינו למצוא רווח בר סמך: