الوصف الاحصائى لبيانات متغيرين (المجتمعات الغير مستقله) جامعة الملك سعود- المملكة العربية السعودية
5-1 مقدمةIntroduction العرض الاحصائى لمتغيرين لن يختلف كثيرا عن العرض الاحصائى لمتغير واحد. قد يكون المتغيرين المراد وصفهما احصائيا من نفس النوع ( كمية، وصفية) او احداهما متغير كمى والآخر متغير وصفى (نوعى) وقد تختلف أو تتشابه وحدات القياس لهما وبصفة عامة يمكن عرض البيانات المزدوجة كالآتى:- جدولة البياناتTabulation : وهو وضع البيانات فى جدول احصائى مزدوج ويصلح للبيانات النوعية والكمية والمختلطة وهو يصف العلاقة بين المتغيرين بالاضافة الى وصف بيانات كل متغير على حده ( التوزيعات الهامشية). تمثيل البيانات بيانياGraphical Representation : وهو التعبير عن البيانات المزدوجة بشكل بيانى يتلائم مع طبيعة البيانات.
حساب بعض المقاييس الاحصائيةStatistical Measures : يمكن التعبير عن البيانات الاحصائية بحساب مقياس احصائى مثل معامل الارتباط وهو مقياس نسبى يستخدم لقياس درجة واتجاه العلاقة بين المتغيرين. وتوجد مجموعة من معاملات الارتباط تصلح لجميع وحدات القياس المختلفه. وايضا حساب بعض المقاييس الاحصائية لكل متغير على حده بالاضافة الى طرق العرض السابقة فان الجداول المزدوجة يمكن استخدامها فى اجراء اختبار الاستقلالTest of Independent ويساعد هذا الاختبار فى معرفة هل المتغيرات الممثله فى الأعمده وبالصفوف مستقله عن بعضها او لا. وسوف نتعرض هنا لدراسة كلا من الطرق السابقه على حده.
جدوله البيانات عن طريق الجداول المزدوجه Cross Tables
قبل الحديث عن كيفية انشاء الجدول التكرارى المزدوج توجد عدة ملاحظات: البيانات النوعية والكمية المتقطعة يجب ان يكون عدد تقسيمات المتغيرات فى الجدول المزدوج ليس كبيرا ويفضل ان تكون اقل من عشرة تقسيمات بالنسبة للمتغير الكمى المستمر يجب ان يتم تكويد بيانات المتغير فى فئات قبل الجدوله ليس ما هناك ما يمنع ان تكون المتغيرات داخل الجدول مختلفه فى طبيعتها او فى وحدة قياسها.
باستخدام الملف data4.sav سوف نقوم بعدة عمليات على البيانات التى يحتويها اولا انشاء الجدول المزدوج لمتغيرين نوعيين بانشاء الجدول المزدوج للنوع Gender ومستوى التعليم Education فنقوم بالخطوات التالية:
من قائمة analyze نختار Descriptive Statistics من القائمة الفرعيه نختار Crosstabs تظهر شاشة جديدة بعنوان Crosstabs ننقل المتغير Gender لقائمة Row(s) وننقل المتغيرEducation لقائمة Column(s) لتمثيل البيانات بيانيا باستخدام الأعمدة المزدوجة نختار Display clustered bar charts لحجب الجدول المزدوج للمتغيرين نختار Suppress tables
نختارCells لتحديد محتوى الخلية فتظهر شاشة جديده بعنوان Crosstabs: Cell Display من Count سوف نختار Observed حيث يستخدم لتعين عدد المشاهدات فى كل خلية ويمكن استخدام Expected لتعين التوقعات لكل خلية والذى يستخدم عند اجراء اختبار الاستقلال.
من Percentages سوف نختار Row, Column, Total ويقوم بتعين نسبة الخلية للعمود او الصف او المجموع الاختيار Residuals يستخدم لتعين البواقى 10- نضغط على Continue للعودة للشاشة السابقة 11- نختار Statistics تظهر شاشة جديدة بعنوانCrosstabs: Statistics 12- تحتوى الشاشة على عدة خيارات الاختيار Correlations لتعين معامل ارتباط بيرسون بين المتغيرين للبيانات الكمية الاختيار Chi-square يستخدم لإجراء اختبار الاستقلال بين المتغيرين وتوجد عدة مقاييس اخرى خاصة بالاحصاءات الترتيبيه يمكن تعين اى منها فيمكن اختيار معامل التوافق Contingency Coefficient
13- نختار Continue للعودة للشاشة السابقة 14- باختيار Format تظهر الشاشة الفرعية التالية للتحكم فى شكل النتائج ثم نختار Continue ثم Ok تظهر النتائج التالية
النتائج Output
الجدول الأول: عرض ملخص عن الحالات من حيث عدد الحالات المستخدمه وعدد القيم المفقوده ونسبه كلا منها. الجدول الثانى: هو الجدول المزدوج بين النوع Gender فى الصفوفRows ومستوى التعليمEducation فى الأعمدةColumn والخلايا تحتوى على كلا من عدد القيم ونسبه كل قيم بالنسبة للنوع وايضا التعليم والمجموع فعلى سبيل المثال الخليه الأولى تحتوى على العدد 1 فتعنى انه يوجد شخص واحد من النوع Female وحاصل على Highter والذى يمثل7.7% من النوعFemale ويمثل14.3% من المتعلمينHigher وايضا 4% من العدد الكلى للبيانات. لاحظ الصف والعمود الآخيرين فى الجدول المزدوج فهى تمثل التوزيعات الهامشية للمتغيراتGender وايضا Education
الجدول الثالث: بعنوان Chi-square tests والذى يستخدم لاختبار الاستقلال بين المتغيرين ويكون فرض العدم: هو استقلال المتغيرات، والفرض البديل: عدم استقلال المتغيرات. وقد استخدم هنا اختبارى Pearson Chi-square وايضاLikelihood Ratio ونجد انه فى الحالتين قيمة Sig. وهى اكبر من α/2=0.025 وبالتالى سوف نقبل فرض العدم وهو الاستقلال.
الجدول الرابع: بعنوان Symmetric Measure ويحسب معامل التوافق0.429 وسوف لانهتم بالاشارة هنا لأنه موجب باستمرار وقام البرنامج باختبار معنوية الارتباط وسيكون فرض العدم: الارتباط غير معنوى (لايوجد ارتباط) والفرض البديل: الارتباط معنوى (يوجد ارتباط) ونجد ان sig.= 0.06 وبالتالى نقبل فرض العدم وهو عدم وجود ارتباط بين عناصر مجتمعى النوع والتعليم المختار منهم العينه.
الشكل البيانى: هو الأعمدة البيانية للجدول المزدوج
ثانيا انشاء الجدول المزدوج لمتغيرين احداهما نوعى والأخر كمى متقطع بانشاء الجدول المزدوج للنوع Gender وعدد الأولادchildren فنقوم بالخطوات التالية:
من قائمة analyze نختار Descriptive Statistics من القائمة الفرعيه نختار Crosstabs تظهر شاشة جديدة بعنوان Crosstabs ننقل المتغير Gender لقائمة Row(s) وننقل المتغير Children لقائمة Column(s) نكرر ما سبق من الخطوة4 حتى 14 نحصل النتائج التالية
ثالثا انشاء الجدول المزدوج لمتغيرين احداهما نوعى والأخر كمى مستمر بانشاء الجدول المزدوج للنوع Gender والدخل Income_1 فنقوم بالخطوات التالية: يجب اولا تكويد المتغير الكمى المستمرincome_1 فى المتغيرIncome_c والتعامل داخل الجدول المزدوج بمركز الفئات. 800-100 600-800 400-600 200-400 الفئة 900 700 500 300 مركز الفئة
بتكرار ما سبق على المتغيرات Gender ، Income_c سوف نحصل على النتائج التالية:
ثالثا انشاء الجدول المزدوج للمتغيرات الكمية اذا كانت المتغيرات الكمية مستمرة فيجب تكويدها ( اى التعبير عنها بفترات) قبل التعامل معها لكن اذا كانت متقطعه ( منفصله) سنتعامل معها مباشرة. وسنكرر ما سبق
التمثيل البيانى للبيانات المزدوجه باستخدام شكل الانتشار Scatter Plot
يستخدم شكل الانتشار للتعرف على نوع ودرجة العلاقة بين المتغيرين المستمرين. ومن شكل الانتشار يمكن التعرف على طبيعة العلاقة بين المتغيرين هل هى علاقة خطيه ام لا؟ شكل الانتشار ما هو الا تمثيل للبيانات المزدوجة بنقاط على محورين احداهما المحور السينى ويمثل عادة المتغير المستقل والمحور الصادى ويمثل المتغير الغير مستقل (المتغير التابع). ومن شكل الانتشار اذا تجمعت البيانات حول خط يصنع زاوية حادة او منفرجة مع المحور الافقى فتكون العلاقة بين المتغيرين خطيه. اذا كانت العلاقة خطيه واقتربت النقاط من بعضها حول خط وهمى كانت العلاقة قويه اذا وقعت النقاط جميعها فوق الخط فى العلاقة الخطية( أو الشكل فى العلاقة الغير خطية) كانت العلاقة تامه.
سوف نتعامل هنا مع الملف data6 سوف نتعامل هنا مع الملف data6.sav والذى يحتوى درجات 30 طالب فى اربعة مواد Stat, Phy, Chem, Math . سوف نتعامل هنا مع القائمة Graphs
من قائمة Graphs نختارScatter/Dot تظهر شاشة جديدة بعنوانScatter/ Dot نختار Simple Scatter نضغط على Define تظهر شاشة جديد بعنوان Simple Scatter Plot
ننقل المتغير المستقل الى خانةX Axis والتابع الى خانةY Axis بالضغط على Titles تظهر شاشة جديدة بعنوان Titles نحدد فيها عنوان الرسم البيانى
ثم نختار Continue فنعود للشاشة السابقة بالضغط على Options تظهر شاشة جديد بعنوان Options نحدد فيها كيفية معالجة القيم المفقودة، ثم نختار Continue نعود للشاشة السابقة بالضغط على Ok سوف يظهر الشكل البيانى التالى.
ويتضح من شكل الانتشار ان البيانات غير متجمعة حول خط مستقيم ولا تاخذ شكل معين لذا فان الارتباط ضعيف.
تعيين معامل الارتباط كمقياس بين المتغيرات المزدوجه Linear Correlation
1- معامل الارتباط بين متغيرات الكميه 1-1 معامل الارتباط بين متغيرين تتعدد مقاييس الارتباط بين متغيرين، حيث يتوقف اختيار معامل الارتباط على وحدة قياس المتغيرين واحيانا بعض الفروض، وتجاهل الفروض اللازمة لحساب معامل الارتباط يؤدى الى التوصل الى نتائج واستنتاجات غير دقيقة. يعتبر معامل ارتباط بيرسون من اكثر المقاييس استخداما ودقة فهو يصف العلاقة بين متغيرين مستمرين. ومعامل ارتباط بيرسون له عدة مسميات اخرى مثل Product-Moment Correlation أوZero-Order Correlation. ولحساب معامل ارتباط بيرسون توجد عدة فروض يجب ان تكون البيانات فى صورة ازواج مرتبطه وحدة القياس لابد ان تكون بفتره على الأقل البيانات لكل متغير يجب ان تتوزع طبيعيا العلاقة بين المتغيرين يجب ان تكون خطي
اذا كان لدينا الملفdata7 اذا كان لدينا الملفdata7.sav يحتوى على درجات الطالب معدل الطالب فى الصف الثالث الثانوىX ومعدله فى شهادة الدراسه الثانويةY . يجب اولا التحقق من الشروط السابقة
1- اختبار هل كل متغير على حده يتبع التوزيع الطبيعى وذلك باستخدام اختبار باستخدام الأمر Frequencies نجد ان المتغيرين لهما التوزيع الطبيعى بيانيا.
باستخدام الأمر Explore نجد ان المتغيرين لهما التوزيع الطبيعى.
2- العلاقة بين المتغيرين علاقة خطيه سوف نستخدم شكل الانتشار للمتغيرين 2- العلاقة بين المتغيرين علاقة خطيه سوف نستخدم شكل الانتشار للمتغيرين. ومن الشكل يمكن تقريب العلاقة لخط مستقيم والعلاقة علاقة طردية قويه.
وبالتالى يمكن تعين معامل ارتباط بيرسون بين المتغيرين X, Y عن طريق من قائمة Analyze نختار Correlate من القائمة المنسدلة نختارBivariate لأنه يوجد متغيرين فقط تظهر شاشة جديدة بعنوانBivariate Correlations
ننقل المتغيرات X, Y لخانةVariables نختار نوع معامل الارتباط من قائمةCorrelation Coefficients وسيكون Pearson لاحظ وجود نوعين اخرين من معاملات الارتباط ويسميان Non-parametric Coefficient Correlation ويستخدمان عند عدم تحقق شرط التوزيع الطبيعى لبيرسون وهماKendall`s tau-t , Spearman ولكلا منهما شروط عند استخدامه البيانات التى لدينا هى عينه من مجتمعات فيمكن اختبار معنوية الارتباط عن طريقTest of Significance لبيانات المجتمعات المختاره منها العينات.
بالضغط على Options تظهر شاشة بعنوان Bivariate Correlations: Options ومنها نحدد Statistics التى نرغب فى تعينها للمتغيرات وكذلك كيفية التعامل مع القيم المفقوده ثم نختار Continue فنعود للشاشة السابقة نضغط Ok تظهر النتائج التالية
الجدول الأول: بعنوان Descriptive Statistics يحتوى على بعض المقاييس الاحصائية مثل الوسط والانحراف المعيارى وعدد القيم لكل متغير الجدول الثانى: بعنوان Correlations ويحتوى على قيمة معامل الارتباط واختبار معنوية الارتباط ونجد ان قيمة معامل الارتباط هى0.966 وهو ارتباط طردى قوى كما اوضح شكل الانتشار قيمةSig. = 0.00 وهى اقل من α/2 لذا سوف نرفض فرض العدم وهو عدم وجود معنويه ونقبل الفرض البديل بوجود معنوية ( الاختبار ذو طرفين)
1-2- معامل الارتباط بين اكثر من متغيرين اذا كان لدينا اكثر من متغيرين كميين فيمكن حساب ما يسمى بمعامل الارتباط الجزئىPartial Correlation وهو يحسب لمتغيرين فقط فى حالة ثبوت بقية المتغيرات الاخرى ويتم حسابه تحت نفس الشروط لمعامل ارتباط بيرسون. اذا كان لدينا البيانات الملفdata6.sav فيمكن حساب معامل الارتباط الجزئى بين stat, chem مع ثبوت مستوى الذكاءiq
يجب اولا التحقق من ان البيانات لكل متغير تتبع التوزيع الطبيعى؟ باستخدام اختبار طبيعية البيانات باستخدام الأمر Explore نجد ان قيمة Sig فى كلا الاختبارين مع جميع المتغيرات اكبر من 0.05 لذا سوف نقبل فرض العدم وهو ان البيانات تتبع التوزيع الطبيعى
2- ويمكن التحقق من باقى الشروط وسوف نقوم بحساب معامل الارتباط تبعا للخطوات التالية 1- من قائمةAnalyze نختار Correlate ثم ننقر على Partial 2- تظهر شاشة جديده بعنوان Partial Correlations ننقل المتغيرين Stat, chem لقائمة variables وننقل المتغير math لخانة Controlling for:
3- نضغط على Option لتحديد المقاييس الاحصائية المراد حسابها للمتغيرات وكيفية التعامل مع القيم المفقوده ثم نضغط Continue نعود للشاشة السابقة 4- من الأمر Test of Significance نختار Two-tailed لنحصل على اختبار معنوية الارتباط من طرفين.
5- ثم نختار Ok تظهر النتائج التالية
الجدول الأول: بعنوان Descriptive Statistics عرض الوسط الحسابى والانحراف المعيارى وعدد القيم لكل متغير من المتغيرات الثلاثة. الجدول الثانى: بعنوان Correlations عرض معامل الارتباط الجزئى وقيمة Sig. = 0.528 وهى اكبر من α/2 لذا فانه لا توجد دلالة لمعامل الارتباط.
2- معامل الارتباط بين المتغيرات النوعية اذا كان لدينا الملفdata4.sav ونريد تعين معامل الارتباط بين المتغيرين النوعيينGender, Education
لا يمكن التعامل مع البيانات النوعية لذا فيمكن التغلب على ذلك عن طريق تكويد بيانات كلا من المتغيرين ثم التعامل معها
يجب قبل حساب معامل الارتباط اختبار هل البيانات تتبع التوزيع الطبيعى ام لا. ومن الأمر Explore نجد ان قيمة Sig. اقل من 0.05 لذا سوف نرفض فرض العدم: البيانات لها التوزيع الطبيعى ونقبل الفرض البديل: البيانات ليس لها التوزيع الطبيعى. لذا لا يمكن استخدام معامل ارتباط بيرسون وهذا منطقى لأن البيانات النوعية يستخدم لتعيين معامل الارتباط لها معامل ارتباط سبيرمان للرتب. سوف نكرر ما سبق لتعين معامل الارتباط لكننا سوف نحدد Spearman
وبالتالى يمكن تعين معامل ارتباط سبيرمان للرتب بين المتغيرين gen_code, Edu_code عن طريق من قائمة Analyze نختار Correlate من القائمة المنسدلة نختارBivariate لأنه يوجد متغيرين فقط تظهر شاشة جديدة بعنوانBivariate Correlations ننقل المتغيرات Edu_code, gen_code لخانةVariables نختار نوع معامل الارتباط من قائمة Correlation Coefficients وسيكون Spearman
البيانات التى لدينا هى عينه من مجتمعات فيمكن اختبار معنوية الارتباط عن طريقTest of Significance لبيانات المجتمعات المختاره منها العينات. بالضغط على Options تظهر شاشة بعنوان Bivariate Correlations: Options ومنها لاحظ الاختيار Statistics غير نشط لأننا نتعامل مع بيانات نوعية تم تكويدها وليست بيانات كمية لكن الاختيار Missing values نشط ويوضح كيفية التعامل مع القيم المفقوده ثم نختار Continue فنعود للشاشة السابقة نضغط Ok تظهر النتائج التالية
لاحظ أن الارتباط طردى ضعيف وقيمته هى 0. 355 وقيمة Sig. = 0 اختلاف طريقة التكويد لا يؤثر على النتائج للبيانات النوعية.