Search for LIMS content across all our Wiki Knowledge Bases.
Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.
الانحدار الخطي[6] أو نموذج الانحدار الخطي أو النموذج الخطي في الإحصاء، هو نموذج إحصائي يستخدم في تفسير متغير عبر متغير آخر (أو مجموعة من المتغيرات ) وفق دالة خطية.
يسمى المتغير بالتابع والمتغيرات بالمتغيرات المستقلة أو المفسرة، بمعنى أنها تفسر، إحصائيا، تغير المتغير التابع.[7]
الانحدار الخطي وتحليل الارتباط، رغم اشتراكهما في نفس القاعدة الإحصائية، إلا أنهما يختلفان على مستوى أدوار المتغيرات. إذا كان تحليل الارتباط يتعامل مع المتغيرين و على قدم المساواة، أي بصورة تماثلية، فتحليل الانحدار يجب أن يعتمد على تقعيد نظري قبلي يؤسس لحد أدنى من التراتبية السببية بين المتغيرات.[7] على سبيل المثال في النظرية الاقتصادية: تفسير ظاهرة الاستهلاك بدلالة الدخل (مع ثبات العوامل الأخرى) انطلاقا من أن استهلاك الفرد مرتبط بالدخل.[8][9][10] وهو ما يعطي للباحث شرعية لوضع علاقة بين المتغيرات الاقتصادية على شكل دالة: ، مع المتغير التابع (الاستهلاك) و المتغير المستقل (الدخل).
غالبا ما تكون الخبرة المعرفية في مجال الدراسة هي منطلق وضع النموذج، بأهداف استكشافية أو تأكيدية أو تحكيمية:
استكشافية: لاستكشاف وجاهة متغير ما في تفسير ظاهرة معينة (مثلا العمر كمفسر لارتفاع الضغط الدموي).[7]
تأكيدية: كما في حالة صيغة دوبري المؤكدة لخاصية ارتباط ضغط غاز الزئبق () مع درجة الحرارة (): والتي يمكن تأكيدها إحصائيا عبر نموذج انحدار خطي يطبق على التحويل اللوغاريتمي للمعادلة.[11]
تحكيمية: في سياق التعلم المراقب حيث يمكن النموذج من الفصل والتحكيم بين مجموعة من المتغيرات المفسرة حسب قوتها التفسيرية.
1866: أول ظهور لمصطلح انحدار (بالإنجليزية: Regression) في أعمال فرانسيس غالتون، حيث طبق نموذج الانحدار الخطي البسيط في نمذجة قامات الأطفال المولودين لآباء ذوي قامات غير اعتيادية (فارعة أو قصيرة الطول) مبينا بأن قامات الأطفال تؤول نحو المتوسط الحسابي لقامة الساكنة.[11]
التحليل الوصفي
أشكال الدالة
يمكن أن تأخذ الدالة أشكالا مختلفة قد تكون خطية، لوغارتمية، أو أسية... الخ، ويمكن تحويل أي نموذج إلى النموذج الخطي، سنركز على الانحدار الخطي البسيط في قياس العلاقة بين المتغيرات:
i=1,..,n
حيث أن هي معلمات النموذج وعنصر الخطأ العشوائي، تم إضافته مراعاة للصفة الاحتمالية للنموذج ويمثل الفرق بين القيم الفعلية والقيم النظرية، وبالتالي قد تكون قيمته موجبة أو سالبة وتشترط أن تكون القيمة المتوقعة تساوي صفر.
تقعيد نظري
يشار للعينة الإحصائية ب تضم فردا إحصائيا ببياناتهم وفق صنفين من المتغيرات:
: المتغير التابع.
(أو مجموعة متغيرات ، مع ): المتغيرات المستقلة أو المفسرة.
توجد ثلاثة أشكال لكتابة نماذج الانحدار الخطي: الكتابة العادية (أو القياسية) والكتابة المتجهية والكتابة المصفوفاتية.
الكتابة القياسية
لكل فرد إحصائي ، تكتب نمذجة القيمة المتحققة بدلالة قيم المتغيرات المفسرة والخطأ الإحصائي :
الكتابة المتجهية
يشار لمتجهة المعاملات ولمنقولة متجهة القيم المتحققة ب وتكتب النمذجة:
الكتابة المصفوفاتية
أحيانا، تستعمل الكتابة المصفوفاتية للتعبير عن النموذج بشكل شامل، وأيضا لتسهيل البرهنة على الخصائص الاستدلالية المرتبطة بالنموذج:
بحيث:
تقدير النموذج
تقدير النموذج يعني بالأساس تقدير القيم المقدرة للمعاملات (والتي تعتبر معالم النموذج)، إضافة إلى التصديق الإحصائي على نجاعة النموذج وقابلية تطبيقه واستغلاله عمليا، خصوصا في توقع قيم مستقبلية (أو جديدة) ل بمعرفة قيم . توجد أربع طرق لتقدير نموذج الانحدار الخطي:
أكثر الطرق استعمالا، وأكثرها نجاعة، هي طريقة المربعات الدنيا: حسب مبرهنة كاوس ماركوف، وفي حالة تحقق الفرضيات المنصوص عليها في المبرهنة، فمقدر المربعات الدنيا يكون أفضل مقدر خطي بدون تحيز (بالإنجليزية: Best Linear Unbiased Estimator) ويشار إليه اختصارا ب BLUE.
طريقة المربعات الدنيا
قبل تطبيق طريقة المربعات الدنيا لتقدير المعالم الإحصائية لنموذج الانحدار، يجب التأكد من تحقق مجموعة من الفرضيات، وخصوصا فرضيات مبرهنة غاوس ماركوف (المتعلقة بالخصائص الإحصائية لأخطاء النموذج الخطي الإحصائية). تنقسم الفرضيات إلى صنفين: فرضيات بنوية (Systemic) يجب التأكد منها قبل تطبيق النموذج وفرضيات تصادفية (Stochastic) يتم التأكد منها بعد كل تكرار لتطبيق النموذج إلى غاية بلوغ صيغة مستقرة وقابلة للتطبيق.
الفرضيات البنوية
الفرضية : عدم وجود أخطاء إحصائية في ملاحظة و (مفهوم الخطأ هنا يشمل الأخطاء القياسية والتحيزات التي يمكن أن تكون ناتجة عن أخطاء منهجية في الاستعيان مثلا).
عمليا، يتم التأكد من الفرضيات، في الغالب، عبر اختبارات إحصائية، وغالبا ما تكون العملية تكرارية ويمكن أن تستلزم القيام بتطبيق دوال تحويلية على المتغيرات، أو استثناء عناصر إحصائية من العينة، حتى تقترب العينة المدروسة من البنية المثلى الموافقة للفرضيات. عمليا، من الصعب تحقق كل الفرضيات بصورة كاملة، ولذلك يجب مرافقة الدراسة بمقاربة تحكيمية تحقق التوافق بين الهدف من النمذجة وجودة البيانات المتوفرة وإمكانية الوصولية إلى بيانات أخرى.
أمثلة لطرق التأكد من الفرضيات البنيوية والتصادفية لنمذجة الانحدار الخطي
^ ابجمُعرِّف الغرض الرَّقميُّ (DOI): 10.3238/arztebl.2010.0776. الرَّقم التَّسلسليُّ المِعياريُّ الدَّوليُّ (ISSN): 1866-0452. تاريخ النشر: 5 نوفمبر 2010. العنوان: Linear Regression Analysis. الوصول: 12 أكتوبر 2024. اسم المُؤَلِّف بالحروف: Astrid Schneider, , .
^مذكور في: Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow : concepts, tools, and techniques to build intelligent systems. المُؤَلِّف: Aurélien Geron. لغة العمل أو لغة الاسم: الإنجليزية. تاريخ النشر: 2019.
^مُعرِّف الغرض الرَّقميُّ (DOI): 10.38094/jastt1457. الرَّقم التَّسلسليُّ المِعياريُّ الدَّوليُّ (ISSN): 2708-0757. تاريخ النشر: 31 ديسمبر 2020. العنوان: A Review on Linear Regression Comprehensive in Machine Learning. الوصول: 12 أكتوبر 2024. اسم المُؤَلِّف بالحروف: Dastan Maulud, .
^Hawkins، Douglas M. (1973). "On the Investigation of Alternative Regressions by Principal Component Analysis". Journal of the Royal Statistical Society, Series C. ج. 22 ع. 3: 275–286. JSTOR:2346776.