الإحصاء الحيوي Biostatistics التوزيع الطبيعي Normal Distributions
التوزيع الطبيعي Normal Distribution يعتبر التوزيع الطبيعي من اشهر وأهم التوزيعات الاحتمالية المتصلة ، حيث تتعدد تطبيقاته في الحياة ، كما أن كثير من التوزيعات الاحتمالية اشتقت من التوزيع الطبيعي. اذا تم أخذا قياسات معين لخلايا أو أعدادها أو نباتات أو أشخاص أو حتى قياس سرعة تفاعل حيوي (عبر جهاز spectrophotometer) ، وتم وضع هذه القياسات المتباينة في جداول تكرارية ومن ثم تمثيلها بالمدرج التكراري Histogram ، ستظهر البيانات كما في الشكل التالي
معادلة المنحنى الطبيعي Normal Curve equation هذا الشكل من البيانات يقال عنه أنه موزع طبيعياً ، حيث أن معظم القياسات قريبة من الوسط ، وتبتعد القيم القليلة عن الوسط. معادلة المنحنى الطبيعي حيث أن Y هو ارتفاع المنحنى ،لأي نقطة X ، e العدد النيبيري 2.71828 و π 3.14 μ , σ2 هما التباين والمعدل لمتغير عشوائي لاحظ أن المتغير X والذي يخضع للتوزيع الطبيعي يمكن أن يحدد توزيعه الطبيعي بمعرفة μ , σ2 من وحسب المعادلة الرياضية السابقة ويمكن رسم منحناه الي يشبه الجرس
التوزيع الطبيعي Normal Distribution خصائص التوزيع الطبيعي المنحنى يأخذ شكل الجرس bell-shaped curve متماثل حول الوسط الحسابي mean μ ، يقع منوال واحد فقط عند x = μ في المنحنى الطبيعي توجد قمة واحدة حيث تتساوى قيمة كل من الوسط الحسابي مع الوسيط مع المنوال يتقارب طرفا منحنى الطبيعي من الصفر عندما X تؤول الى ما لا نهاية ∞ في الاتجاه الموجب أو السالب. المساحة تحت المنحنى الطبيعي تساوي 1 ، ونظرًا للتماثل حول الوسط فإن المساحة على يمين الوسط تساوي المساحة على يسار الوسط.
التوزيع الطبيعي Normal Distribution هناك نسب معينة من المساحة الواقعة ضمن أي عدد من الانحرافات المعيارية عن الوسط كما في الشكل 68.26% ضمن μ ± 1σ 95.45% ضمن μ ± 2σ 99.74% ضمن μ ± 3σ
التوزيع الطبيعي Normal Distribution مثال1: تتبع سيدة حمية غذائية لمدة ثلاثة ايام اسبوعيا ، ووجد ان فقدانها لوزنها يخضع للتوزيع الطبيعي بمعدل 600 g وانحراف معياري 200 g . ما هي النسبة التي ستفقدها السيدة من وزنها اذا فقدت من 400 g الى 600 g ؟ الحل: بما أن 68.26 هي مساحة محصورة تحت المنحنى الطبيعي ل μ ± 1σ ، اذا النسبة المساوية لفقد بمعدل 200±6000 أو μ ± 1σ هي 68% .
التوزيع الطبيعي Normal Distribution يعتمد التوزيع الطبيعي على قيم الوسط μ Mean ، والتباين. من الممكن أن يكون المنحنيان طبيعيان و لهما نفس الانحراف المعياري ، لكن الوسط مختلف.
التوزيع الطبيعي Normal Distribution أو لهما نفس الوسط لكن الانحراف المعياري يختلف .
التوزيع الطبيعي Normal Distribution أو يختلفان في الوسط والانحراف المعياري.
المساحة تحت المنحنى Areas under the Normal Curve تعلمنا أن منحنى التوزيع الطبيعي يعتمد على معدل التوزيع μ وعلى التباين ، فإذا علمنا قيمة كل منهما يمكن ايجاد احتمال وقوع المتغيرالعشوائي X داخل المساحة تحت المنحنى المحاطة ب x = x1 و x = x2 أي أننا نستطيع ايجاد المساحة المساوية للقيمة P(x1 < x < x2) .
التوزيع الطبيعي المعياري Standard normal distribution أهمية التوزيع الطبيعي المعياري عرفنا أن هناك العديد من التوزيعات الطبيعية والتي تعتمد على قيم μ , σ2 ، ولتحديد المساحة تحت المنحنى لتحديد احتمال أي متغير عشوائي يقع في الفترة ، يجب تصميم أعداد لا نهائية من الجداول الطبيعية حسب قيم المعدل والتباين وهو من المستحيل. من ناحية أخرى ، التوزيع الطبيعي المعياري له μ = 0 و σ2 =1 وهو ما يقلص حاجتنا لجداول الأعداد للتوزيعات الطبيعية لـ جدول التوزيع الطبيعي المعياري. عندما تقع X بين القيم x = x1 وx = x2 فإن المتغير العشوائي Z يقع بين القيم
التوزيع الطبيعي المعياري Standard normal distribution الشكل الأيسر يمثل التوزيع الطبيعي، والشكل الأيمن يمثل التوزيع الطبيعي المعياري
التوزيع الطبيعي المعياري Standard normal distribution مثال2: افترض أن مستوى الهيموغلوبين للرجال البالغين يخضع للتوزيع الطبيعي تقريبًا بمعدل mean 16 وتباين variance 0.81 ، أوجد احتمال اختيار رجل سليم عشوائيا له مستوى هيموغلوبين أقل من 14 الحل: هذا يعني أننا سنوجد P(x < 14) نرسم المنحنى ونحدد المساحة الى اليسار 14 ومن ثم تحويل X=14 الى قيمة Z المناسبة ومن ثم ايجاد المساحة عبر الجدول حسبما هو معطى نحسب Z ومن ثم نذهب الى الجدول لنوجد الاحتمال هذا يعني أن 1.3% من الرجال السليمين مستوى الهيموغلوبين لديهم أقل من 14
التوزيع الطبيعي المعياري Standard normal distribution مثال3: لنفترض أن مستوى الكوليسترول لدى النساء الفلسطينيات اللواتي يتراوح أعمارهن 21-30 عام يخضع للتوزيع الطبيعي تقريبًا بمعدل 4.7 mmol/l وبتباين 0.25 ، أوجد احتمال اختيار امرأة بشكل عشوائي لها مستوى كوليسترول أعلى 5.6 mmol/l ؟ الحل : سنوجد P(x> 5.6) ، ثانياً نرسم المنحنى. وحسب المعطى نوجد قيمة Z
التوزيع الطبيعي المعياري Standard normal distribution مثال4: يخضع معامل الذكاء IQ : Intelligence Quotient للتوزيع الطبيعي تقريبًا ب μ = 100 وσ = 15 . ماهي نسبة الأشخاص الذين لديهم معامل الذكاء من 80 الى 120 ؟ الحل: لنفترض أن x1 = 80 and x2 = 120 هذا يعني أن السؤال تحول الى ايجاد احتمال نرسم المنحنى ونوجد قيم Z عند القيمتين x1 = 80 and x2 = 120
التوزيع الطبيعي المعياري Standard normal distribution بما أن P(x1<x<x2) =P (z1<z<z2) إذا نوجد المساحة المطلوبة بطرح مساحة من مساحة وباستخدام الجدول هذا يعني أن نسبة الأشخاص الذين لديهم معامل الذكاء 80-100 يساوي 0.8164 أو 82% .
ايجاد قيمة Z لمساحة معطاة مثال5: اذا كان هناك توزيع طبيعي بمعدل μ = 40 و σ = 6 أوجد قيمة x التي لها: 45% من المساحة أقل منها ؟ 14% من المساحة أعلى منها ؟ الحل: في هذا النوع من الأسئلة سيتم عكس الحل السابق ، حيث سنبدأ بمساحة معلومة لنوجد Z ومن ثم منها نوجد X حسب العلاقة التالية والتي نحصل منها على المساحة المساوية ل .45 هي المساحة المظللة من الشكل ، من الجدول نحتاج قيمة Z التي تمثل هذه المساحة ........ بمعنى P(z < ?) = 0.45
ايجاد قيمة Z لمساحة معطاة المطلوب الثاني هو مساحة .14 من اليمين والموضحة في الجزء المظلل من الشكل التالي والتي تعني المساحة المقدرة ب .86 من اليسار فالمطلوب اذا ..... P(z < ?) = 0.86 من الجدول قيمة Z = 1.08 ومنها قيمة X تساوي 46.48 عند التعويض بالعلاقة
اختبار التوزيع الطبيعي Assessing normality ليست جميع المتغيرات العشوائية المتصلة تخضع للتوزيع الطبيعي، من المهم تقييم كيف تبدو البيانات من ناحية قربها من التوزيع الطبيعي. في هذا الجزء سنتعرف على بعض الطرق التي من الممكن عبرها الحكم على البيانات والقول عنها أنها موزعة طبيعيا. أولا : المعرفة السابقة بطبيعة التوزيع مثال : لو أن باحثًا متخصصا في الكائنات البحرية يود أن يعرف هل حجم الكائن البحري نجم البحر (طول الأذرع )يخضع للتوزيع الطبيعي أم لا فكيف يحكم بذلك؟ المعرفة والأعمال السابقة مع هذا النوع من نجم البحر تظهر أنه يخضع للتوزيع الطبيعي. للباحث أعمال ودراسات سابقة قريبة من هذا النوع تظهر أنه موزع طبيعيا. للباحث دراسات سابقة على نجم البحر بشكل عام تظهر أنه موزع طبيعيا.
اختبار التوزيع الطبيعي Assessing normality ثانيا: رسم المخططات من الممكن رسم مخطط الساق والورقة أو مخطط الصندوق وطرفيه box-and whisker لأحجام متوسطة من العينات ، عندها ستبدو هذه المخططات متماثلة. للعينات الكبيرة من الممكن رسم المدرج التكراري أو المضلع التكراري ومن ثم ملاحظة ما اذا كان الشكل يشبه الجرس أم لا ، مشاهدة الالتواءskewness والتماثل symmetry . والتماثل لا يعني يجزم أن البيانات أتت من مجتمع يخض للتوزيع الطبيعي. لذلك يلجأ الى طرق أخرى لمعرفة اذا كانت تختلف عن التوزيع الطبيعي.
اختبار التوزيع الطبيعي Assessing normality ثالثا: عد المشاهدات ضمن 1,2,3 من الانحراف المعياري عن الوسط ومقارنتها بالنتائج المتوقعة للتوزيع الطبيعي في لقواعد 68% ، 95% ، 99.7% حيث أن 68% من البيانات تقع ضمن انحراف معياري واحد عن الوسط 95% من البيانات تقع ضمن ضعف الانحراف المعياري عن الوسط. 99% من البيانات تقع ضمن 3أضعاف الانحراف المعياري عن الوسط.
اختبار التوزيع الطبيعي Assessing normality مثال: الجدول التالي يمثل أطوال طلاب مساق الإحصاء ل 25 طالب من الجامعة الاسلامية في أحد الفصول الدراسية . هل هذه العينة من أطوال الطلاب أخذت من مجتمع يخضع للتوزيع الطبيعي؟
اختبار التوزيع الطبيعي Assessing normality لطريقة العد يجب عمل التالي: 17 مشاهدة من المشاهدات ال 24 أو 17/24 = 0.70ومنه = 70% من هذه المشاهدات تقع ضمن بمعنى بين 72.9 و68.3 والتي تساوي تقريبًا 68% لذلك نستطيع الحكم بأن هذه العينات مصدرها مجتمع خاضع للتوزيع الطبيعي
اختبار التوزيع الطبيعي Assessing normality رابعا: حسابات الاحصاء الوصفي يجب أن تتساوى قيم كل من الوسط والوسيط والمنوال نصف المدى الربيعي مساوٍ أو مقارب ل 1.33 S . المدى تقريبا 6 S .
اختبار التوزيع الطبيعي Assessing normality خامسا: قياس الالتواء والتفرطح Measure of Skewness and Kurtosis حيث أن التوزيع الطبيعي يكون متماثل ، أما الغير متماثل فيقال عنه ملتوٍ Skewed حساب الالتواء يكون عبر العلاقة التالية
اختبار التوزيع الطبيعي Assessing normality التفرطح ، ويكون شكل الجرس وهو النموذج الطبيعي شاذا من ناحية وجود قمة أو تحدبها. ولحساب التفرطح يلجأ للعلاقة التالية