مقاييس الارتباط والتراجع الخطي Measures of Correlation and Liner regression

نظرة عامة

مقاييس الارتباط والتراجع الخطي:

Measures of Correlation and Liner regression

الارتباط Correlation هو خطوات إحصائية تتيح لنا قياس درجة ارتباط متغيرين ببعضهما البعض بحيث إذا تغير أحدهما تغير الآخر بالزيادة أو النقصان، فإذا ازداد أحدهما وازداد الآخر نتيجة لذلك يقال أن بينهما علاقة طردية وأن ارتباطهما موجب، أما إذا ازداد أحدهما فنقص الآخر فالعلاقة عند ذلك تكون عكسية والارتباط بينهما سالب. وعادة ما نقوم بحساب معامل الارتباط Correlation Coefficient بين متغيرين حسب نوع البيانات والتوزيع الذي تنتمي إليه تلك البيانات. وهناك أنواع متعددة من مقاييس الارتباط أهمها "معامل بيرسون للارتباط"Pearson Correlation Coefficient ويرمز له بالرمز (r) ويتم حسابه لمتغيرين موزعة بياناتهما توزيعاً طبيعياً للحصول على قيمة رقمية عن قوة العلاقة بين هذين المتغيرين، وهذه القيمة تتراوح بين (+1) و(-1)، بينما تمثل القيمة صفر عدم وجود أي ارتباط بينهما. أما الإشارة الموجبة فتعني أن الارتباط موجب والعلاقة طردية، والإشارة السالبة تعني أن الارتباط سالب والعلاقة عكسية، وكلما اقتربت قيمة (r) من الرقم (1) كلما كانت العلاقة قوية بغض النظر عن الإشارة.

من ناحية أخرى، عندما تكون البيانات غير موزعة توزيعاً طبيعياً فإننا نقوم بحساب معامل ارتباط آخر هو "معامل سبيرمان للارتباط" Spearman Correlation Coefficient ويرمز له بالحرف الإغريقي (ρ) "ويلفظ رو" ويتم حسابه عن طريق الرتب ranks وينطبق على القيمة الناتجة منه ما ينطبق على (r).

أما التراجع الخطي Linear regression (ويسمى أحياناً الانحدار الخطي) فإنه يختلف قليلاً عن الارتباط، ففي الارتباط يحاول الباحث التعرف على الدرجة التي يتغير بها متغيران بالنسبة لبعضهما البعض، أما في حالة التراجع الخطي، فإن الباحث يدرس مقدار التغير في أحد المتغيرين عندما يتغير المتغير الآخر بالزيادة أو النقصان، ونستطيع معرفة العلاقة relationship بين المتغيرين حسب معادلة الخط المستقيم التالية:

Y = a + b X

حيث Y هو المتغير المرتبط (التابع) dependent variable، وX هو المتغير المستقل independent variable، وa هو القاطع intercept وb هو الميل (أو الانحدار) slope.

وهناك أنواع أخرى كثيرة من التراجع regression مثل التراجع الخطي المتعدد multiple linear regression، وهو بين متغير مرتبط واحد وعدة متغيرات مستقلة، والتراجع اللاخطي Nonlinear regression وغيرها من الأنواع الأخرى والتي لا يتسع المجال لمناقشتها هنا.

 

تقييم الجزء الإحصائي للدراسات الإكلينيكية:

هناك الكثير من الأسئلة التي يجب سؤالها عند تقييم الجزء الإحصائي من أي دراسة إكلينيكية، وسوف نلخص بعض هذه الأسئلة في النقاط التالية:

  • هل قام المؤلف بتحديد ما إذا كانت مجموعات الدراسة متجانسة homogeneous، دون تحيز bias لمجموعة معينة، وتم اختيار المجموعات بطريقة عشوائية random؟ وهل قام المؤلف بتعديل الخط القاعدي baseline للمجموعات؟
  • ما هي نوعية البيانات data type التي حصل عليها المؤلف؟ وهل قام باستخدام الاختبار الإحصائي المناسب لنوعية هذه البيانات؟
  • إذا كانت الاختبارات الإحصائية غامضة أو غير معروفة، فما الذي دفع الباحث إلى استخدامها؟ وهل ذكر مرجعاً بهذا الخصوص؟
  • هل تم تحديد البيانات حسب بروتوكول الدراسة Study protocol الأصلي المذكور في جزء الطرائق Methods؟
  • هل تم التعرف على القيم الناشزة Outliers أو المتطرفة extreme values بطرق إحصائية متعارف عليها أو بأي طريقة أخرى؟
  • هل تم التفريق بين الترابط Correlation وبين التراجع الخطي linear regression؟ وهل تم حساب معامل الترابط Correlation Coefficient وتم تفسيره بشكل صحيح؟
  • هل تم تعيين "الترافق" association بين المتغيرات في حالة وجوده؟
  • هل تم حساب قيمة p الإحتمالية (p-value) وتم تفسيرها بشكل صحيح؟
  • هل تم حساب فترة الثقة Confidence Interval؟ وهل تعكس استنتاجات المؤلف هذه الفترة؟
  • هل توجد معلومات عن طريقة تعيين حجم العينة Sample size وهل حجم عينة الدراسة مناسب؟ وإذا لم يكن مناسباً، هل تم تحديد "القوة" power لهذه العينة؟
  • هل تم حساب المقاييس الإحصائية الوصفية descriptive statistics مثل المتوسط والانحراف المعياري وغيرها؟
  • بوجه عام، هل هناك أي ملاحظات أخرى على الطرائق الإحصائية التي تم تحليل البيانات بواسطتها.

 

وسوم :

تحليل احصائي بحوث ودراسات محلل احصائي