گروه كارشناسي ارشد مديريت فنآوري اطلاعات(واحد الكترونيكي تهران) بسمه تعالي تحليل آماري Statistical Analysis گروه كارشناسي ارشد مديريت فنآوري اطلاعات(واحد الكترونيكي تهران) مدرس: دكتر مهرداد پيدايي M.peidaie@gmail.com Good Morning Everyone! My name is Sanjay Shah and I am the CEO of Skelta Software
مولانا
فهرست مطالب طرح درس آزمون نسبت موفقيت در جامعه مروري بر مفهوم آمار و تاريخچه آن مفاهيم كليدي در آمار تحليلي روش هاي نمونه گيري مقياسهاي اصلي اندازه گيري قضيه حد مركزي تخمين و انواع آن تخمين فاصله اي ميانگين جامعه آماري تخمين فاصله اي تفاضل ميانگين دو جامعه تخمين فاصله اي نسبت موفقيت جامعه روش هاي تعيين حجم نمونه آزمون فرضيه هاي آماري آزمون فرضيه آماري ميانگين يك جامعه آزمون فرضيه آماري ميانگين دو جامعه آزمون مقايسه زوج ها آزمون نسبت موفقيت در جامعه آزمون فرض آماري براي واريانس جامعه رگرسيون و ضريب همبستگي آزمون كاي دو آزمون U- من ويتني آزمون ويلكاكسون آزمون علامت آزمون كولموگروف و اسميرنوف تصميم گيري نرم افزار MINITAB و كاربرد آن
(انجام تمرينهاي هفتگي + پاسخگويي به سوالات + حضور مستمر) طرح درس هدف سرفصل كلي مطالب تركيب نمره : 5 نمره = فعاليت كلاسي (انجام تمرينهاي هفتگي + پاسخگويي به سوالات + حضور مستمر) 15 نمره= امتحان پايان ترم منبع : آمار و كاربرد آن در مديريت 2 (دكتر عادل آذر و منصور مومني، انتشارات سمت)
تاريخچه آمار
استنباط از داده های نمونه تعریف علم آمار با استفاده از جداول فراوانی، نمودارها و مشخص کننده های عددی توصیف داده ها جمع آوری داده ها آمار علم با استفاده از همبستگی و پیوستگی وبررسی رابطه بین متغیرها و نیز داده های جامعه آماری برای رسیدن به استنباط از داده های نمونه با استفاده از برآورد(تخمين) و آزمون های آماری می باشد
لزوم استفاده از آمار در مديريت پاسخ به بررسی سئوالات تحقيق قابل استفاده کردن داده های جمع آوری شده با توصیف داده ها (بكار گيري عملياتي نتايج تحقيق) رد يا تاييد فرضیه های پژوهش
مراحل اساسي انجام پژوهش علمي و نیاز به آمار در فصل 4 مراحل اساسي انجام پژوهش علمي و نیاز به آمار در فصل 4 فصل1 كليات تحقيق مقدمه بيان مسئله اهميت مسئله و اهداف فصل2 بيان پيشينه تدوين مدل مفهومي اصول و مباني علمي تحقيقات پيشين تدوين فرضيه ها فصل3 متدولوژي تحقيق جامعه ونمونه آماري آزمونهای مورد استفاده روايي و اعتبار فصل4 تحليل داده ها تحليل داده هاي جمعيت شناختي تحليل توصيفي داده ها تحليل استنباطی داده ها فصل5 جمعبندي نتيجه گيري پيشنهادها
آمار توصیفی آمار استنباطی پس براین اساس آمار به دو دسته تقسیم می شود آمار1 (مقدماتي) آمار توصیفی آمار 2 (آمار تحليلي) آمار استنباطی
آمار تحليلي جامعه(N) ، ميانگين( µ ) ، انحراف معيار( σ ) ، نسبت (π) آمار استنباطي(تخمين و آزمون) نمونه(n) ، ميانگين(x ) ، انحراف معيار( s )،نسبت(p)
آماره و پارامتر پارامتر: ويژگي هاي عددي هر جامعه آماري را پارامتر ان جامعه گويند. آماره: ويژگي هاي عددي نمونه آماري را آماره مي گويند.
جامعه(N) :population نمونه(n) : sample تعريف؟؟ نمونه گيري فرايندي است كه طي آن تعدادي از واحد ها به گونه اي انتخاب مي شوند كه معرف جامعه بزرگتر كه از آن انتخاب شده اند مي باشد. جامعه(N) :population تعريف؟؟
روشهاي نمونه گيري sampling methods تصادفي ساده تصادفي سيستماتيك تصادفي طبقهاي خوشهاي روشهاي نمونه گيري تصادفي Random sampling methods روش در دسترس روش هدفمند روشهاي نمونه گيري غيرتصادفي Non Random sampling methods
جامعه نمونه الف ج ب د خ ت پ ك ق ل رظ ض ث س ص ف م ذ ط ب ج ي ف ص ض م خ س الف ج ب د خ ت پ ك ق ل رظ ض ث س ص ف م ذ ط ب ج ي ف ص ض م خ س ح ش گ الف هـ ب ج ي ف ص ض م خ س ح ش گ الف هـ الف ب ج ح 25% خ پ ك م هـ ش ي ط 50% ف ق ص گ س ح ي ف م خ تصادفي طبقهاي نمونه برداري نمونه برداري تصادفي ساده تصادفي خوشهاي نمونه برداري تصادفي دومرحلهاي نمونه برداري ب 25% خ ش م ي 50% ف ج گ ذ س م ع ط خ م خ ي ف س ح ي م س نمونه
مقياس هاي اصلي اندازه گيري نوع مقياس كيفي كمي اسمي Nominal مقياس هايي هايي كه فقط بوسيله اسمشان از هم جدا مي شوند ترتيبي Ordinal مقياسهايي هستند كه هم توسط اسمشان جدا مي شوند وهم ترتيبي نيز در آنها وجود دارد فاصله اي Interval داراي خصوصيات اسمي –ترتيبي مي باشد و با عدد نشان داده مي شود نسبي Ratio داراي خصوصيات اسمي –ترتيبي –فاصله اي است و نيز داراي صفر مطلقي مي باشد
مثال شاخص مركزي آزمون هاي آماري نوع اسمي رتبه اي فاصله اي نسبي مقياس ها مثال شاخص مركزي آزمون هاي آماري نوع اسمي مرد ، زن مد پارامتريك كيفي رتبه اي خيلي خوب ، خوب ، متوسط و... مد و ميانه فاصله اي درجه سانتي گراد مد، ميانه و ميانگين ناپارامتريك كمي نسبي متر
توزيع نرمال توزیع نرمال یا توزیع گوسی ( یا گاوسی ) یکی از توزیعهای احتمالاتی پیوستهی مهم است. به تجربه ثابت شده است که در دنیای اطراف ما توزیع بسیاری از متغیرهای طبیعی از همین تابع پیروی می کنند. منحنی رفتار این تابع، تا حد زیادی شبیه به زنگ های کلیسا می باشد و به همین دلیل به آن Bell Shaped هم گفته میشود.فرمول آن بر حسب ،دو پارامتر امید ریاضی و واریانس بیان میشود. با وجود اینکه ممکن است ارتفاع و نحوه انحنای انواع مختلف این منحنی یکسان نباشد اما همه آنها یک ویژگی یکسان دارند و آن مساحت واحد میباشد. به طور كلي اگر چنانچه مجموعه اي از اعداد را داشته باشيد و آنها را بصورت صعودي مرتب نماييد و ميانگين اين اعداد را حساب كنيد در صورتي كه تعداد اعداد كمتر از ميانگين برابر تعداد اعداد بيشتر از ميانگين باشد توزيع مورد نظر نرمال مي باشد. سوال) آيا توزيع نمرات ترم قبلتان نرمال بوده است؟
قضيه حد مركزي اگر توزيع جمعيت، يک توزيع نرمال باشد، توزيع نمونه نيز نرمال خواهد بود. (حتي اگر توزيع جمعيت نرمال هم نباشد، توزيع نمونه اي به شرط وجود نمونه کافي تقريبا نرمال خواهد بود) ميانگين توزيع نمونه اي = ميانگين جمعيت انحراف معيار توزيع نمونه اي = خطاي معيار (SE) و برابر است با
قضيه حد مركزي N,μ,σ …. μ
راهنمايي:از فرمول زير استفاده نماييد. تمرين) مجموعه اعداد زير را در نظر گرفته و مقدار انحراف معيار آن را محاسبه نماييد. x=8,7,5,4,12,15,10,13,14,12 راهنمايي:از فرمول زير استفاده نماييد.
مفاهيم كليدي در آمار استنباطي جامعه آماري نمونه آماري مقياس اندازه گيري منحني نرمال آماره پارامتر توزيع نرمال آزمون آماري تخمين توزيع جامعه محدود و ناحدود آزمون هاي پارامتريك آزمون هاي ناپارامتريك آزمون همقوارگي نمونه هاي مستقل نمونه هاي وابسته فرضيه هاي پژوهشي فرضيه هاي آماري قضيه حد مركزي متغير پيوسته و گسسته شاخص هاي مركزي و پراكندگي سطح معني داري تكليف: تعريف يا مفهوم موارد فوق را تا هفته آينده تهيه كرده و ايميل نماييد.
پايان جلسه اول
تخمين آماري Estimation اگر تحقيق از نوع سوالي و صرفا حاوي پرسش درباره پارامترها باشد براي پاسخ به سوالات از تخمين آماري استفاده مي شود و اگر حاوي فرضيه ها بوده و از مرحله سوال گذر كرده باشد آزمون فرضيه ها و فنون آماري آن بكار برده مي شود. تخمين ها بر دو نوع كلي فاصله اي و نقطه اي مي باشند كه در چندين حالات بر اساس ويژگي هاي جامعه ، مورد مطالعه قرار مي گيرند.
تخمين فاصله اي ميانگين يك جامعه آماري ميانگين جامعه(µ=؟ ) تخمين ميانگين(x )
حالت اول) توزيع جامعه نرمال با انحراف معيار معلوم: در اين حالت از فرمول زير استفاده مي شود: s £ m £ x = - a p ( x z z s ) 1 - + a x x a x 2 2 سطح اطمينان s s مقدار Z از جدول صفحه 413 بدست مي آيد. = x x n
جدول z از صفحات 413 و 414 كتاب مثال)
مثال1) بررسي ها نشان مي دهد كه توزيع وزن شيشه هاي توليد شده در يك كارخانه بزرگ نرمال و انحراف معيار آن 21 تن است . از آنجا كه سنجش وزن شيشه ها بطور روزانه ممكن نيست يك نمونه 50 قطه اي از توليدات انتخاب شده كه ميانگين وزن آن 871 تن است. در سطح اطمينان 90 درصد ميانگين واقعي شيشه هاي توليد شده را در طي يك روز محاسبه كنيد. تفسير: با اطمينان 90 درصد مي توان ادعا نمود كه ميانگين واقعي وزن شيشه هاي توليد شده بين 866 و 875 تن مي باشد و فقط 10 درصد احتمال دارد كه ميانگين مورد نظر خارج از اين محدوده باشد. 5درصد احتمال دارد اين ميانگين بالاتر از 875 بوده و 5 درصد احتمال دارد كمتر از 866 باشد.
مثال2) مطالعات نشان مي دهد توزيع معدل دانشجويان در واحد علوم و تحقيقات نرمال بوده و از انحراف معيار 1.5 برخوردار است. يك نمونه 25 نفري از دانشجويان رشته هاي مختلف انتخاب شده كه ميانگين نمرات آنها 13.75 مي باشد. در سطح اطمينان 95 درصد ميانگين واقعي نمرات دانشجويان را تخمين بزنيد. تفسير: با اطمينان 95 درصد مي توان ادعا نمود كه ميانگين نمرات دانشجويان بين 13.16و 14.33 مي باشد و فقط5 درصد احتمال دارد كه ميانگين مورد نظر خارج از اين محدوده باشد. 2.5درصد احتمال دارد اين ميانگين بالاتر از 14.33بوده و 2.5درصد احتمال دارد كمتر از 13.16باشد.
تمرين)تحقيقات انجام شده حاكي از آن است كه توزيع قد دانشجويان نرمال بوده و داراي انحراف معيار 10 سانتي متر مي باشد. يك نمونه 36 نفري از دانشجويان انتخاب شده كه ميانگين قد آنها 169 سانتي متر است. در سطح اطمينان 90 %، 95% و 99% طول واقعي قد دانشجويان را تحمين بزنيد.
حالت دوم) توزيع جامعه نرمال با انحراف معيار نا معلوم: درصورتي كه تعداد نمونه كوچكتر يا مساوي 30 باشد از فرمول زير استفاده مي كنيم: درصورتي كه تعداد نمونه بزرگتر از 30 باشد از فرمول زير استفاده مي كنيم:
جدول T مثال) صفحه 415 كتاب
مثال1) بازاريابي در صدد بررسي و برآورد قدرت خريد ساكنان يك محله در تهران مي باشد او ناچار بايد يك نمونه تصادفي 10 تايي از بين خريداران انتخاب و قدرت خريد هر يك را اندازه گيري كند. قدرت خريد نمونه فوق بر حسب ده هزار تومان چنين است: x=8,7,5,4,12,15,10,13,14,12 قدرت خريد ساكنان محله از توزيع نرمال برخوردار است . در سطح اطمينان 95 درصد ميانگين قدرت خريد را برآورد نماييد. چون تعداد نمونه كمتر از 30 است لذا از فرمول زير استفاده مي كنيم: تفسير: با اطمينان 95 درصد مي توان ادعا نمود كه قدرت خريد ساكنان محله بين 72610تومان و 127390 تومان مي باشد.و فقط 5درصد احتمال دارد كه قدرت خريد ساكنان محله خارج از اين محدوده باشد.
مثال2) يك ترمينال مسافربري، در ايام نوروز طي يك تحقيقي 64 اتوبوس را بصورت تصادفي مورد مطالعه قرار داده كه ميانگين سرعت آنها 100 كليومتر در ساعت بوده است. با فرض انحراف معيار 10 كليومتر در ساعت، ميانگين سرعت حركت اتومبيل ها را تخمين بزنيد. چون تعداد نمونه بالاتر از 30 است لذا از فرمول زير استفاده مي كنيم: تفسير: با اطمينان 95 درصد مي توان ادعا نمود كه سرعت اتومبيل ها بين 97.55 و 102.45 كليومتر در ساعت مي باشدو تنها 50 درصد احتمال دارد كه خارج از اين محدوده باشد. بعبارت ديگر 2.5 درصد احتمال دارد كه ميانگين سرعت اتومبيل ها كمتر از 97.55 بوده و 2.5 درصد احتمال دارد بيشتر از 102.45 كليومتر در ساعت باشد.
تمرين) محققي بدنبال برآورد سطح عملكرد كاركنان يك سازمان مي باشد او بصورت تصادفي 9 نمونه از بين كاركنان انتخاب كرده كه امتياز عملكرد آنها به شرح زير مي باشد: 30-31-30-28-27-29-27-32-18 با فرض نرمال بودن سطح عملكرد كاركنان، امتياز عملكرد كل كاركنان را در سطح اطمينان 99درصد تخمين بزنيد.
حالت سوم) توزيع جامعه غير نرمال باشد: درصورتي كه تعداد نمونه كوچكتر يا مساوي 30 باشد از فرمول زير استفاده مي كنيم: درصورتي كه تعداد نمونه بزرگتر از 30 باشد از فرمول زير استفاده مي كنيم:
مثال1)از شيشه هايي كه با يك دستگاه پر شده يك نمونه تصادفي 25 تايي انتخاب شده كه ميانگين آن 250 ميلي ليتر و انحراف معيار آن 10 ميلي ليتر است. هيچ دليلي بر نرمال بودن توزيع مايع ريخته شده در شيشه ها وجود ندارد در سطح اطمينان 95 درصد ميانگين كل مايع ريخته شده در شيشه ها را برآورد نماييد. چون جامعه غير نرمال بوده و تعداد نمونه كمتر از 30 تاست لذا از فرمول زير استفاده مي كنيم: تفسير: باحداقل 95درصد اطمينان مي توان گفت كه ميانگين كل مايع ريخته شده بين 2410.06 و 258.94 مي باشد.
تمرين1) يك كارخانه نوشابه سازي اخيرا اقدام به توليد نوع جديدي از نوشيدني نموده كه بطور تصادفي 16 نمونه از آن انتخاب نموده ايم. ميانگين هر بطري پر شده 500 ميلي ليتر و انحراف معيار آن 20 ميلي ليتر است. با فرض نرمال نبودن حجم شيشه ها ميانگين كل حجم بطري ها در سطح اطمينان 95 درصد تخمين بزنيد. تمرين2) مركز كنترل كيفيت يك شركت خودروسازي، درصدد تعيين ميانگين تعداد قطعات معيوب در خودروهاي توليدي خود مي باشد. اين مركز بصورت تصادفي 9 خودرو را انتخاب كرده و تعداد قطعات معيوب را بصورت زير ثيت كرده است: 26-27-46-72-14-25-31-38-40 الف)تعداد قطعات معيوب را با فرض نرمال بودن تعداد قطعات محاسبه نماييد. ب)تعداد قطعات معيوب را با فرض غير نرمال بودن تعداد قطعات محاسبه نماييد.
تخمين فاصله اي تفاضل ميانگين دو جامعه جامعه دوم جامعه اول نمونه اول نمونه دوم
حالت اول) توزيع دو جامعه نرمال و انحراف معيارهاي دو جامعه معلوم: 2 1 , ) ( n z x p s a m + = - ú û ù ê ë é £ نحوه تفسير نتايج: اگر هر دو دامنه مثبت باشد: µ1> µ2 اگر هر دو دامنه منفي باشد: µ1< µ2 در غير اينصورت : اختلاف معني دار نيست
مثال1) محققي قصد دارد عملكرد مديران دو موسسه را مورد مقايسه قرار دهد اين محقق از موسسه آلفا يك نمونه تصدفي 25 نفره انتخاب كرده كه داراي ميانگين امتياز عملكرد 60 مي باشد و از سازمان بتا يك نمونه تصادفي 20 نفره انتخاب كرده كه ميانگين آن 55 مي باشد با فرض نرمال بودن جامعه و انحراف معيار آلفا و بتا برابر 10 و 12 ، نحوه عملكرد اين دو موسسه را در سطح اطمينان 99 درصد مقايسه كنيد. آلفا بتا n1=25 n2=20 X1=60 X2=55 σ1=10 σ2=12 تفسير: اختلاف عملكرد دو موسسه در سطح اطمينان 99 درصد معني دار نيست (حالت سوم)
حالت دوم) توزيع دو جامعه نرمال و انحراف معيارهاي دو جامعه نا معلوم: 2-1- اگر چنانچه انحراف معيار هاي دو جامعه برابر باشند از فرمول زير استفاده مي كنيم: 2-2- اگر چنانچه انحراف معيار هاي دو جامعه برابر نباشند از فرمول زير استفاده مي كنيم:
چون انحراف معيارها برابر است لذا از فرمول زير استفاده مي كنيم: مثال1) هدف محققي مقايسه عملكرد سازمانهاي آلفا و بتا مي باشد. در اين از سازمان آلفا يك نمونه 9 تايي انتخاب شده كه ميانگين آن 45 و انحراف معيارش 12 است. در حالي كه ميانگين و انحراف معيار سطح آمادگي كاركنان در موسسه بتا در يك نمونه 15 نفره به ترتيب 55 و 14 است فرض كنيد توزيع نمره هاي سطح آمادگي كاركنان دو سازمان نرمال و واريانس هاي دو جامعه يكسان است. در سطح اطمينان 90 درصد تخمين لازم را براي مقايسه ميانگين دو جامعه بعمل آوريد. چون انحراف معيارها برابر است لذا از فرمول زير استفاده مي كنيم: تفسير: چون هر دو دامنه منفي است لذا در سطح اطمينان 90 درصد مي توان گفت ميانگين سازمان آلفا كمتر از سازمان بتا مي باشد بعبارتي سازمان بتا بهتر از سازمان آلفاست.(حالت دوم)
حالت سوم) توزيع دو جامعه مورد بررسي غير نرمال باشد: 2-1- اگر درجه آزادي بالاتر از 30 باشد از فرمول زير استفاده مي كنيم: 2-1- خلاف حالت فوق در دنياي عمل به ندرت اتفاق مي افتد لذا بدليل اهميت كم از اين حالت صرف نظر مي شود. تفسير مثل حالت دوم مي باشد.
تمرين) پژوهشگري در صدد است عملكرد كاركنان دو بانك را مورد مقايسه قرار دهد او از بانك اول 16 نفر و از بانك دوم 19 نفر را بصورت تصادفي انتخاب كرده كه ميانگين امتياز عملكردشان به ترتيب 28 و 26 مي باشد با فرض انحراف معيار نمونه اول برابر 2 و انحراف معيار نمونه دوم برابر 3 عملكرد كاركنان اين دو بانك را مورد مقايسه قرار دهيد.
تخمين فاصله اي نسبت موفقيت جامعه جامعه، P اين تخمين پايه و اساس تعيين حجم نمونه در مطالعات كيفي با مقياسهاي اسمي و رتبه است كه فرمول اصلي آن به شكل زير است: نمونه ، p
نسبت افرادراضي را در سطح اطمينان 90 درصد محاسبه نماييد. مثال1) هدف محققي تعيين نسبت افراد ناراضي در سازمان مي باشد از آنجاييكه دسترسي به تمام افراد سازمان ميسر نيست محققان 400 نفر را بطور تصادفي انتخاب كرده اند كه فقط 32 نفر از كار خود ناراضي هستند نسبت افراد ناراضي را در سطح خطاي يك درصد برآورد نماييد. n=400 , x=32 p=32/400=0.08 تفسير: نسبت افراد ناراضي در سازمان بين 4.5 درصد تا 11.5درصد كل كاركنان مي باشد بعبارت ديگر نسبت افراد ناراضي با 99 درصد اطمينان برابر 11.5 درصد است. نسبت افرادراضي را در سطح اطمينان 90 درصد محاسبه نماييد.
نمونه(n) ، ميانگين(x ) ، انحراف معيار( s ) تعيين حجم نمونه جامعه(N) ، ميانگين( µ ) ، انحراف معيار( σ ) n=? نمونه(n) ، ميانگين(x ) ، انحراف معيار( s )
روش هاي تعيين حجم نمونه الف) اصل تجربه ميانگين سه تحقيق مشابه استفاده از نسبت هزينه ب)استفاده از تكنيكهاي آماري برآورد ميانگين (جامعه محدود(1)، جامعه نامحدود(2)) برآورد نسبت (جامعه محدود(3)، جامعه نامحدود(4)) ج)استفاده از جدول مورگان
در صورتي كه جامعه محدود باشد از فرمول زير استفاده مي كنيم: حالت اول)تعيين تعداد نمونه زماني كه هدف تحقيق برآورد ميانگين جامعه باشد در صورتي كه جامعه محدود باشد از فرمول زير استفاده مي كنيم: 2 ) 1 ( * x z N n s e a + - = در صورتي كه جامعه نامحدود باشد از فرمول زير استفاده مي كنيم:
مثال1) پژوهشگري علاقمند است ميانگين رشدكاري كاركنان يك سازمان را تعيين كند او دقت برآورد را 5 در نظر گرفته و تصور مي كند انحراف معيار نمره هاي رشد كاري كاركنان 20 نمره باشد اندازه نمونه را در سطح خطاي 5 درصد برآورد نماييد.
در صورتي كه جامعه محدود باشد از فرمول زير استفاده مي كنيم: حالت دوم)تعيين تعداد نمونه زماني كه هدف تحقيق برآورد نسبت موفقيت در جامعه باشد در صورتي كه جامعه محدود باشد از فرمول زير استفاده مي كنيم: در صورتي كه جامعه نامحدود باشد از فرمول زير استفاده مي كنيم:
مثال1)مطالعه اي براي تعيين نسبت موفقيت مديران وظيفه مدار در سطح سازمانهاي دولتي كشور برنامه ريزي شده است. اين تصور وجود دارد كه نسبت مزبور بزرگتر از 0.45 نيست. حدود اطمينان 95درصد و سطح خطاي مجاز 0.08 مورد نظر است. بنظر شما چند مدير بايستي مورد مطالعه قرار گيرد.
چند نكته مهم تكميلي سطح اطمينان در صورتي كه ارائه نشود 95 درصد در نظر گرفته شود مقدارp يا نسبت موفقيت جهت حداكثر شدن تعداد نمونه 0.5 در نظر گرفته شود مقدار خطاي مجاز در تحقيقات علوم انساني بطور تجربي 0.07 در نظر گرفته مي شود
تمرين) محققي قصد دارد در يك سازمان 1592 نفري اقدام به نمونه گيري كند وي هيچ اطلاعات ديگري از تحقيقات پيشين بدست نياورده است. مطلوبترين تعداد نمونه براي انجام اين تحقيق چقدر است؟(از فرمولها استفاده شود)
جدول مورگان یکی از ساده ترین راههای تعیین حجم نمونه استفاده از جدول مورگان است.در جدول مورگان حجم جامعه ذکر شده و در مقابل آن حجم نمونه ی متناسب با آن آمده است. Kerjcie and Morgan Determining Sample Size for research activities. Educational and psychological Measurement: 1970.30.607-610.
آزمون فرضيه هاي آماري Hypothesis Testing استفاده از آزمون زماني است كه علاوه بر سوال در تحقيق خود فرضيه نيز داشته باشيم كه بطور كلي هدف از آزمون آماري آن است كه با توجه به اطلاعات بدست آمده از داده هاي نمونه، حدس خود را در مورد جامعه به طور قوي رد يا قبول كنيم. فرضيه هاي آماري بر دو نوع فرضيه صفر( ) و فرضيه مقابل( ) مي باشد 1 H H
فرضيه هاي آماري : فرضيه صفر( ) و فرضيه مقابل( ) فرضيه هاي آماري : فرضيه صفر( ) و فرضيه مقابل( ) 1 H H Hypothesis e Alternative H Null : 1 بر اساس برهان خلف بايستي نقيض ادعا(فرضيه پژوهش) باشد و همان ادعاي ما مي باشد. اما اگر چنانچه علامت مساوي در قرار گرفت بايستي جاي ادعا و نقيض ادعا عوض شود يعني ملاك اصلي علامت مساوي(=) مي باشد كه بايستي حتما در قرار گيرد. H 1 H 1 H H مهم
مثال1) فرضيه پژوهشي زير را در نظر گرفته و فرضيه هاي صفر و مقابل آنرا صورتبندي نماييد. ”نسبت مديران مشاركت جو در سازمان بيش از 70 درصد مي باشد“ چون علامت مساوي ندارد لذا در فرضيه مقابل قرار مي گيرد .پس داريم: ادعا: p > 0.7 î í ì > £ 7 . : 1 p H نقيض ادعا ادعا
مثال2) فرضيه پژوهشي زير را در نظر گرفته و فرضيه هاي صفر و مقابل آنرا صورتبندي نماييد. ”ميانگين معدل دانشجويان كلاس دست كم 13 مي باشد“ چون علامت مساوي دارد لذا در فرضيه صفر قرار مي گيرد . پس داريم: ادعا: µ > 13 î í ì < ³ 13 : 1 m H ادعا نقيض ادعا
تمرين1) ميانگين بهره وري خانم ها بيشتر از آقايان است. تمرين2) ميانگين بهره وري مديران جوان در حد مديران مسن مي باشد.
سطح معني داري Significant Level روش كار اين است كه فرض را بنفع رد كنيم بشرط اينكه از يك آزمون آماري، مقداري بدست آوريم كه احتمال وقوع آن مقدار با توجه به برابر يا كمتر از يك احتمال بسيار كوچك باشد . اين احتمال كوچك را سطح معني داري گويند. 1 H H H
سطح معني داري= 0.01 سطح معني داري= 0.5 سطح معني داري= 0.1 0.25 0.25 0.005 0.005 سطح معني داري= 0.5 سطح معني داري= 0.01 0.05 0.05 ؟ سطح معني داري= 0.1 سطح معني داري= 0.1
خطاهاي آماري خطاي نوع اول( ): رد كردن در حالي كه درست است. خطاي نوع اول( ): رد كردن در حالي كه درست است. خطاي نوع دوم( ): پذيرفتن در حالي كه غلط است. H H a H H b گزينه هاي صحيح نتيجه گيري از نمونه درست است غلط است پذيرفته مي شود تصميم درست است رد مي شود H b H a
آزمون فرض يك دامنه و دو دامنه : بستگي به تعريف فرضيه هاي و دارد. اگر چنانچه فرضيه پژوهشي بدون جهت باشد دو دامنه در غير اينصورت يك دامنه خواهد بود 1 H H دو دامنه (Two Tailed) يك دامنه چپ (One Tailed) يك دامنه راست (One Tailed) مهم
مثال1) ميانگين دستمزد كاركنان يك كارخانه كمتر از 200 هزار تومان است. î í ì < ³ 13 : 1 m H مثال2)مردان و زنان تفاوت سطح درجه هوشي ندارند. î í ì ¹ = m w H : 1 تمرين)حداكثر 40درصد از مشتريان شركت راضي هستند.
مراحل عمومي آزمون فرضيه هاي آماري گام اول) تعريف و 1 H H تعيين ادعا و نقيض ادعا گام دوم) تعيين مقدار آماره همان عدد محاسبه شده از فرمولها مي باشد گام سوم) تعيين سطح بحراني تاييدH0 بر اساس عدد جدول مشخص مي شود عدد جدول عدد جدول گام چهارم) تصميم گيري با مقايسه عدد جدول و عدد محاسبه شده مهم
انتخاب آزمونهاي آماري
انتخاب آزمونهاي آماري
آزمون فرضيه آماري ميانگين يك جامعه جامعه آماري استفاده از اين آزمون زماني است كه فرضيه محقق در مورد ميانگين يك جامعه باشد. به عنوان مثال قصد داشته باشد ميانگين قد دانشجويان را در كل جامعه آماري مورد مطالعه قرار دهد . آزمون نمونه(n) ، ميانگين(x ) ، انحراف معيار( s )
مرحله اول) تعريف و 1 H H حالت اول حالت دوم حالت سوم
30 £ n مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون 30 > n 1) جامعه نرمال و انحراف معيار آن معلوم 30 > n 2) جامعه نرمال و انحراف معيار آن نا معلوم 30 £ n
مرحله سوم) تعيين ناحيه بحراني حالت اول حالت دوم حالت سوم مرحله چهارم) تصميم گيري: اگر چنانچه ملاك آزمون در ناحيه بحراني قرار بگيرد فرضيه رد مي شود. H
مثال1) پژوهشگري فرضيه خود را بدين شكل صورتبندي نموده است: ”ميانگين امتياز عملكرد كاركنان در سازمان دست كم 50 است“ وي براي آزمون فرضيه فوق يك نمونه 64 تايي به شكل تصادفي انتخاب كرده كه ميانگين و انحراف معيار آن 45 و 16 مي باشد. در سطح خطاي 5% فرضيه فوق را آزمون نماييد. ادعا نقيض ادعا چون تعداد نمونه بيشتر از 30 مي باشد لذا از فرمول زير استفاده مي كنيم: تصميم گيري: چون ملاك آزمون(-2.5) در ناحيه بحراني قرار رفته پس فرضيه صفر رد مي شود و در نتيجه نقيض ادعا تاييد مي گردد و فرضيه پژوهشي رد مي شود.
مثال2) پژوهشگري فرضيه خود را بدين شكل صورتبندي نموده است: ”ميانگين رضايت شغلي كاركنان 55 مي باشد“ ايشان يك نمونه تصادفي 12 تايي انتخاب كرده كه ميانگين و انحراف معيار آن 60 و 15 است با فرض نرمال بودن سطح رضايت شغلي كاركنان فرضيه محقق را در سطح اطمينان 99 درصد آزمون كنيد.. ادعا نقيض ادعا چون تعداد نمونه كوچكتر از 30 مي باشد لذا از فرمول زير استفاده مي كنيم: تصميم گيري: چون ملاك آزمون(1.155) درخارج از ناحيه بحراني قرار رفته پس فرضيه صفر رد نمي شود و در نتيجه ادعاي محقق تاييد مي گردد و فرضيه پژوهشي پذيرفته مي شود. فرضيه فوق را در سطح اطمينان 90 درصد نيز آزمون نماييد.
آزمون فرضيه آماري ميانگين دو جامعه استفاده از اين آزمون زماني است كه فرضيه محقق در مورد ميانگين دو جامعه باشد. يا به عبارت ديگر بخواهد ميانگين شاخص مورد بررسي را در دو سازمان مورد مقايسه قرار دهد. جامعه آماري (2) جامعه آماري (1) آزمون آزمون نمونه1 نمونه2 نمونه(n) ، ميانگين(x ) ، انحراف معيار( s ) نمونه(n) ، ميانگين(x ) ، انحراف معيار( s )
1 H مرحله اول) تعريف و H حالت اول حالت دوم حالت سوم
مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون 1) دوجامعه نرمال و انحراف معيارهاي آنها معلوم 30 > df 2) دو جامعه نرمال و انحراف معيارهاي آنها نا معلوم 2 1 s = 30 £ df 2 1 s ¹
مرحله سوم) تعيين ناحيه بحراني حالت اول حالت دوم حالت سوم مرحله چهارم) تصميم گيري: اگر چنانچه ملاك آزمون در ناحيه بحراني قرار بگيرد فرضيه رد مي شود. H
مثال)محققي به منظور مقايسه عملكرد مديران دو سازمان كه به روش هاي مشاركتي و دستوري اداره مي شود فرضيه زير را صورتبندي نموده است: ”بهره وري سبك مديريت مشاركتي بهتر از سبك مديريت ستوري است“ او بدين منظور از هر سازمان چند نمونه تصادفي انتخاب كرد كه اطلاعات آنها بشرح زير مي باشد. سبك دستوري سبك مشاركتي n1=15 n1=10 Xb1=45 Xb1=52 S1=8 S1=12 با فرض تساوي واريانس ها و نرمال بودن دو جامعه فرضيه داده شده را در سطح اطمينان 99 درصد آزمون نماييد. نقيض ادعا ادعا df=15+10-2=23<30 تصميم گيري: چون ملاك آزمون(1.757) درخارج از ناحيه بحراني قرار رفته پس فرضيه صفر رد نمي شود و در نتيجه نقيض ادعاي محقق تاييد مي گردد و فرضيه پژوهشي رد مي شود.
تمرين1) مثال قبل را با فرض انحراف معيار جامعه اول برابر 12 و انحراف معيار جامعه دوم برابر 8 حل نماييد. تمرين2)اگر چنانچه تعداد نمونه دوم برابر 25 بشد مساله را مجدد حل كنيد.
آزمون مقايسه زوجها(paired sample test) استفاده از اين آزمون زماني است كه محقق بخواهد اعضاي دو مجموعه متناظر را كه داراي تعداد نمونه يكسان هستند مورد مقايسه قرار دهد. به عنوان مثال قصد مقايسه يك مجموعه اي از شاخص ها را در قبل و بعد از يك اقدام مورد مقايسه قرار دهد. گروه دوم گروه اول n2-1 n1-1 n2-2 n1-2 n2-3 n1-3 n2-4 n1-4 n2-5 n1-5 … … n2-i n1-i
مراحل عمومي اين آزمون همانند آزمونهاي قبلي مي باشد با اين تفاوت كه ملاك آزمون از فرمول زير بدست مي آيد.
مثال1)نمرات وضع موجود و وضع مطلوب شايستگي هاي مديريتي پنج مدير به شكل جدول زير مي باشد: آيا فرضيه زير در سطح اطمينان 99درصد مورد تاييد است؟ ”وضع موجود و وضع مطلوب شايستگي هاي مديريتي مديران تفاوت معني داري دارد و وضع مطلوب بالاتر از وضع موجود است.“ 1 2 3 4 5 وضع موجود 50 59 58 وضع مطلوب 40 57 47 48 نقيض ادعا ادعا 1 2 3 4 5 10- 2- 3- 8- 25 9 تصميم گيري: چون ملاك آزمون درخارج از ناحيه بحراني قرار رفته پس فرضيه صفر رد نمي شود و در نتيجه نقيض ادعاي محقق تاييد مي گردد و فرضيه پژوهشي رد مي شود.
مثال2) نمرات پيش آزمون و پس آزمون پنج فراگير در يك دوره آموزشي به شكل زير مي باشد: آيا فرضيه زير در سطح اطمينان 99درصد مورد تاييد است؟ ”دوره آموزشي مورد نظر اثربخش مي باشد“ 1 2 3 4 5 پيش آزمون 12 8 16 10 پس آزمون 14 13 18 15 نقيض ادعا ادعا 1 2 3 4 5 6 تصميم گيري: چون ملاك آزمون در ناحيه بحراني قرار رفته پس فرضيه صفر رد مي شود و در نتيجه ادعاي محقق تاييد مي گردد و فرضيه پژوهشي پذيرفته مي شود.
آزمون فرضيه آماري نسبت موفقيت در جامعه جامعه آماري استفاده از اين آزمون زماني است كه فرضيه محقق در مورد نسبت موفقيت يك جامعه باشد. و مقياس هاي بكارگرفته شده از نوع مقياس هاي كيفي باشند. آزمون نمونه(n) ، نسبت(p ) ، انحراف معيار( s )
مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون 1 H مرحله اول) تعريف و H حالت اول حالت دوم حالت سوم مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون
مرحله سوم) تعيين ناحيه بحراني حالت اول حالت دوم حالت سوم مرحله چهارم) تصميم گيري: اگر چنانچه ملاك آزمون در ناحيه بحراني قرار بگيرد فرضيه رد مي شود. H
مثال1) فرضيه اي به اين صورت بيان شده است: ” شصت درصد مديران سازمان داراي سبك مديريت دستوري هستند“ محقق 200 نفر مدير را بصورت تصادفي انتخاب كرده كه بطور متوسط نيمي از آنها داراي سبك دستوري هستند. فرضيه فوق را در سطح اطمينان 95درصد آزمون نماييد. ادعا تصميم گيري: از آنجاييكه ملاك آزمون در ناحيه بحراني قرار گرفته لذا فرضيه صفر رد مي شود و در نتيجه ادعا(فرضيه پژوهشي) رد مي شود. نكته: از آنجاييكه ملاك آزمون در دامنه چپ قرار گرفته لذا مي توان گفت كه درصد مديران دستوري كمتر از 60 درصد مي باشد.
مثال2) فرضيه اي به اين صورت بيان شده است: ” 65 درصد از دانشجويان دانشگاه آزاد اسلامي را خانم ها تشكيل مي دهند“ محقق براي آزمون اين فرضيه 150 نفر را بصورت تصادفي انتخاب كرده كه بطور متوسط 60 درصد انها خانم هستند. فرضيه مورد نظر را در سطح اطمينان 99 درصد آزمون نماييد. ادعا تصميم گيري: از آنجاييكه ملاك آزمون در خارج از ناحيه بحراني قرار گرفته لذا فرضيه صفر رد نمي شود و در نتيجه ادعا(فرضيه پژوهشي) پذيرفته مي شود.
تمرين2)اگر چنانچه فرضيه مثال قبل بصورت زير باشد آنرا آزمون نماييد. تمرين1)اگر چنانچه در مثال قبل از در نمونه انتخاب شده 75 نفر خانم باشند فرضيه محقق را مجددا“ آزمون نماييد. تمرين2)اگر چنانچه فرضيه مثال قبل بصورت زير باشد آنرا آزمون نماييد. ”حداكثر 40درصد دانشجويان را پسران تشكليل مي دهند“
آزمون فرضيه آماري براي واريانس جامعه جامعه آماري هرگاه فرضيه اي در مورد پراكندگي جامعه آماري باشد صحت يا سقم آن را مي توان با استفاده از اين آزمون مورد بررسي قرار داد. آزمون نمونه(n) ، نسبت(p ) ، انحراف معيار( s )
مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون مرحله اول) تعريف و 1 H H حالت دوم حالت سوم حالت اول مرحله دوم) محاسبه آماره آزمون يا ملاك آزمون
مرحله سوم) تعيين ناحيه بحراني حالت اول حالت دوم حالت سوم مرحله چهارم) تصميم گيري:اگر مقدار كاي دو در ناحيه بحراني قرار بگيرد فرضيه صفر رد مي شود.
جدول كاي دو صفحه 416 كتاب
مثال1) مديرعامل بازار بورس ادعا كرده است كه ريسك(انحراف معيار) بازده سهام شركتهاي عرضه كننده سهام در بازار بورس كمتر از 5 تومان است. بدين منظور يكي از كارگزاران 25 شركت را بطور تصادفي انتخاب از بين شركتهاي عرضه كننده لنتخاب كزرده كه ميانگين بازده آنها 14 و انحراف معيارشان 4 تومان است. اگر بازده شركتهاي بازار بورس از توزيع نرمال برخوردار باشد ادعا را در سطح اطمينان 95 درصد آزمون نماييد. ادعا تصميم گيري: چون ملاك آزمون در خارج از ناحيه بحراني قرار گرفته لذا فرضيه صفر رد نمي شود و ادعاي مديرعامل پذيرفته نيست. ادعاي مدير عامل را در سطوح اطمينان 90 و 99 درصد نيز آزمون نماييد.
آزمون كاي مربع( ) 2 c يكي از مهمترين آزمونهاي ناپارامتريك آزمون كاي دو است. اساس و پايه اين آزمون بررسي فراواني مشاهده شده كه در طرح هاي تحقيقاتي جمع شده اند با فراواني هاي مورد انتظار است. يعني مي خواهيم بدانيم آيا بين فراواني مشاهده شده و فراواني هاي مورد انتظار تفاوتي معني دار وجود دارد يا آنكه اين تفاوت ناچيز و حاصل شانس است. در واقع می خواهیم بدانیم که بین دو متغیر ارتباطی وجود دارد یا آن دو متغیر مستقل از هم می باشند. توزيع 2 را معمولا وقتی بکار می برند که داده های جمع آوری شده به صورت فراوانی بوده و فرضیه ها بصورت رابطه ای و تفاوتی باشند. داده های جمع آوری شده برای متغير در يک جدول که شامل r سطر و C ستون است خلاصه می شود که به چنين جدولی، جدول «توافقی» گويند. در حالت کلی جدول زير را خواهيم داشت: مجموع C ... 2 1 متغير دوم متغير اول n1. n1c … n13 n12 n11 n2. n2c n23 n22 n21 n3. n3c n33 n32 n31 3 . nr. nrc nr3 nr2 nr1 r n n.c n.3 n.2 n.1 مقادير nij ، فراوانيهای مشاهده شده در هر سلول است که فصل مشترک سطر i و ستون j می باشد. جمع سطر i ، 0 ni و جمع ستون j ، n0j علامتگذاری شده است.
مراحل آزمون استقلال كاي دو مرحله اول) تعريف و 1 H H î í ì : 1 H بين X و Y ارتباط وجود ندارد(مستقل هستند) بين X و Y ارتباط وجود دارد(مستقل نيستند) مرحله دوم) محاسبه آماره يا ملاك آزمون ) 1 )( ( 2 - = S c r df F e مجموع سطر * مجموع ستون کل فراوانی = *´ n Fe j i ) ( .
c 2 a , df مرحله سوم) تعيين ناحيه بحراني با استفاده از اين آزمون مي فهميم كه بين گزينه ارتباط وجود دارد سپس با همبستگي اسپيرمن شدت آنرا برآورد مي كنيم df , 2 a c مرحله چهارم) تصميم گيري: اگر مقدار كاي دو در ناحيه بحراني قرار بگيرد فرضيه صفر رد مي شود.
df 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005 1 --- 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879 2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597 3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838 4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860 5 0.412 0.554 0.831 1.145 1.610 9.236 11.070 12.833 15.086 16.750 6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548 7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278 8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955 9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589 10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188 11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757 12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.300 13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819 14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319 15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801 16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267 17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718 18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156 19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582 20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997 21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401 22 8.643 9.542 10.982 12.338 14.041 30.813 33.924 36.781 40.289 42.796 23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181 24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559 25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928 26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290 27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.195 46.963 49.645 28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993 29 13.121 14.256 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336 30 13.787 14.953 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672 40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766 50 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490 60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952 70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215 80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321 90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299 100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
مثال) فرضيه اي بصورت زير تدوين شده است:“بين عملكرد كاركنان و ميزان رضايت شغلي آنها ارتباط وجود دارد“ براي بررسي فرضيه فوق يك نمونه 180 نفره بطور تصادفي انتخاب شده و ميزان عملكرد و رضايت شغلي آنها اندازه گيري شده است كه اطلاعات آن در جدول زير ارائه شده است. در سطح خطاي 5 درصد فرضيه فوق را آزمون نماييد. رضايت عملكرد بالا متوسط پايين خوب 18 20 7 15 37 38 ضعيف 23 :H0بين X و Y ارتباط وجود ندارد(مستقل هستند) H1:بين X و Y ارتباط وجود دارد(مستقل نيستند) رضايت عملكرد بالا متوسط پايين جمع خوب 18 10 20 7 15 45 37 40 38 30 90 ضعيف 23 80 60 180 تصميم گيري: چون ملاك آزمون در ناحيه بحراني قرار گرفته لذا فرضيه صفر رد مي شود لذا مي توان گفت كه بين عملكرد و رضايت ارتباط وجود دارد و مستقل از هم نيستند.
رگرسيون Regression واژه رگرسیون در فرهنگ لغت به معنی بازگشت است و اغلب جهت رساندن مفهوم "بازگشت به یک مقدار متوسط یا میانگین” به کار می رود. بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند . بیش از ١٠٠ سال پیش در سال ١٨٧٧ فرانسیس گالتون (Francis Galton) در مقاله ای که در همین زمینه منتشر کرد اظهار داشت که متوسط قد پسران دارای پدران قد بلند ، کمتر از قد پدرانشان می باشد . به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده هایش مورد تأکید قرار داد . برای گالتون رگرسیون مفهومی زیست شناختی داشت اما کارهای او توسط کارل پیرسون (Karl Pearson) برای مفاهیم آماری توسعه داده شده . گرچه گالتون برای تأکید بر پدیده "بازگشت به سمت مقدار متوسط" از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می شود .
نمودار پراکندگی : در حقيقت تحليل رگرسيوني فن و تکنيکي آماري براي بررسي و مدل سازي ارتباط بين متغيرها است. رگرسيون تقريباً در هر زمينه اي از جمله مهندسي، فيزيک، اقتصاد، مديريت، علوم زيستي، بيولوژي و علوم اجتماعي برای برآورد و پیشبینی مورد نیاز است . مي توان گفت تحليل رگرسيوني، پرکاربردترین روش در بين تکنيک هاي آماري است. شمايي کلي و خلاصه شده از يک تحليل رگرسيوني ساده به صورت زير مي باشد: در ابتدا تحليل گر حدس مي زند که بين دو متغير نوعي ارتباط وجود دارد ، در حقيقت حدس مي زند که يک رابطه به شکل يک خط بين دو متغير وجود دارد و سپس به جمع آوري اطلاعات کمي از دو متغير مي پردازد و اين داده ها را به صورت نقاطي در يک نمودار دو بعدي رسم مي کند. اين نمودار که به آن نمودار پراکندگي [scatter plot] گفته مي شود نقش بسيار مهمي را در تحليل هاي رگرسيوني و نمايش ارتباط بين متغيرها ايفا مي کند. در صورتي که نمودار نشان دهنده اين باشد که داده ها تقريباً (نه لزوماً دقيق) در امتداد يک خط مستقيم پراکنده شده اند، حدس تحليل گر تأييد شده و اين ارتباط خطي به صورت زير نمايش داده مي شود: y = a x + b که در آن a عرض از مبدأ و b شيب اين خط است.
معادله خط رگرسيون و ضريب همبستگي: Y=ax+b معادله خط رگرسيون و ضريب همبستگي: r = -1 r = +1 r = 0 معكوس كامل مستقيم كامل بي ارتباط معكوس ناقص مستقيم ناقص
مثال) داده هاي زير هزينه تبليغات شركتي را همراه با تعداد فروش محصولش در طي 9 سال مختلف نشان مي دهد. اگر چنانچه هزينه تبليغات 10 واحد باشد مقدار فروش را پيش بيني نماييد.و شدت همبستگي بين فروش و تبليغات را تحليل نماييد. تعداد فروش(y) 11 20 16 24 26 15 21 18 27 هزينه تبليغات (x) 3 5 4 7 9 6 8 Xy=1082∑ xy∑ 33 100 64 68 234 90 105 72 216 X^2 9 25 16 49 81 36 X^2=321 همبستگي مستقيم و ناقص
ضريب همبستگي رتبه اي اسپيرمن در زمانی که بخواهیم رابطه دو متغیر ترتیبی را بررسی نماییم از ضریب همبستگی اسپیرمن استفاده می کنیم. برای پیدا کردن ضریب همبستگی اسپیرمن از فرمول زیر استفاده می کنیم: قابل ذکر است که در محاسبه ضریب همبستگی اسپیرمن ابتدا باید به این مسئله دقت کنیم که متغیرهای ما به صورت ترتیبی چیده شده است یا نه؟ اگر بصورت ترتیبی ( صعودی یا نزولی ) چیده شده باشند براحتی با استفاده از فرمول گفته شده همبستگی اسپیرمن را محاسبه می کنیم اما اگر به ترتیب چیده نشده باشند ابتدا به ترتیب داده ها را می چینیم و بعد با استفاده از فرمول, همبستگی اسپیرمن رامحاسبه می نماییم.
مثال1) در متغییرهای زیر ضریب همبستگی اسپیرمن را محاسبه نمایید؟ di2 di Y X 9 - 3 4 1 6 3 7 rs = 1- 6 * 36 = 1- 216 = -2/6 4(16-1) 60
مثال2 :در متغییرهای زیر ضریب همبستگی اسپیرمن را محاسبه نمایید؟ di2 di Ry Rx Y X 16 - 4 5 1 80 15 - 1 3 2 69 4 41 17 78 18 9 53 19 rs= 1- 6 *30 =1- 180 = - 0/5 5(25-1) 120
رضايت شغلي تعهد سازماني پاسخگوي 1 1 پاسخگوي 2 5 3 پاسخگوي 3 پاسخگوي 4 4 پاسخگوي 5 2 پاسخگوي 6 پاسخگوي 7 پاسخگوي 8 پاسخگوي 9 پاسخگوي 10 پاسخگوي 11 پاسخگوي 12 پاسخگوي 13 پاسخگوي 14 پاسخگوي 15 پاسخگوي 16 پاسخگوي 17 پاسخگوي 18 پاسخگوي 19 پاسخگوي 20 پاسخگوي 21 پاسخگوي 22 پاسخگوي 23 پاسخگوي 24 پاسخگوي 25 پاسخگوي 26 پاسخگوي 27 پاسخگوي 28 پاسخگوي 29 پاسخگوي 30 تمرين) پاسخ 30 نفر از كاركنان يك سازمان در مورد دو متغير رضايت شغلي و تعهد سازماني به شرح جدول زير مي باشد كه اين سوالات در طيف ليكرت ارزيابي شده و به شرح زير ارزشگذاري شده است . آيا بين ايندو متغير ارتباط وجود دارد؟ در صورت وجود ارتباط شدت آنرا بدست آوريد. با استفاده ازنرم افزار excell فرايند پردازش داده هاي فوق را شبيه سازي نماييد.
110
فرمولهاي مهم