ads header

أحدث المقالات

الفرق بين علوم البيانات والاقتصاد القياسي من وجهة نظري

 

 سؤال البحث (Research Question) | European Scientific Research and  Publication Center

لو جاي من خلفية ليها علاقة بالإحصاء أو الاقتصاد القياسي، وبدأت تذاكر علوم بيانات وMachine learning هتتفاجئ إنك بتستخدم نفس النماذج الرياضية اللى درستها في مواد الاحصاء والاقتصاد القياسي زي الإنحدار الخطي Linear Regression والإنحدار اللوجيستي Logistic Regression
طيب ايه الفرق؟
 
في الاقتصاد أو الاحصاء البحته، انت كنت بتركز جدا على المعلمات بتاعت النموذج (الـ Parameters)، المهمة الأساسية اللى كنت بتسعى وراها انك تستخدم العينة اللى عندك علشان تقدر البراميتر بأقصى دقة بحيث تعبر عن القيمة الحقيقية بتاعت المجتمع.
وبالتالي نقدر نقول ان الاحصاء او الاقتصاد القياسي مشكلته هي: Beta hat problem
 
لكن علوم البيانات ونماذج الـ Machine Learning بتركز أكتر على التنبؤ بالمتغير التابع بأقصى دقة ممكنة، بغض النظر عن شكل أو دقة البراميترز اللى وصلتني للتنبؤ الدقيق ده، وبالتالي فالمشكلة هنا هي مشكلة تنبؤ في المقال الأول: Y hat problem
الجميل بقى في علوم البيانات، ان لها منهجية مختلفة تماما عن الاقتصاد القياسي والاحصاء في تحديد مدى دقة النموذج. النماذج الاحصائية التقليدية بتركز على حاجات زي الـ R Squared علشان تشوف النموذج كان قادر على تفسير كام بالمائة من التغيرات اللى حصلت في المتغير التابع. وده مؤشر غير دقيق ولا يمكن الاعتماد عليه فقط من وجهة نظري وهيتضح ليه لما أتكلم عن نماذج علوم البيانات.
 
في نماذج علوم البيانات الفيصل الوحيد في دقة وسلامة النموذج هو قدرته على التنبؤ بالمتغير التابع بدقة لما أدخله بيانات جديدة هو أول مرة يشوفها على الإطلاق، ليه ده معيار سليم؟ لإن لو استخدمت البيانات اللى النموذج اتدرب عليها علشان أحسب أي مؤشر للدقة، فده يعتبر غش، لأن ببساطة النموذج شاف البيانات دي واتدرب عليها كويس فبالتالي غالبا هيكون أداءه عليها جيد، الموضوع أشبه بطالب داخل الامتحان وهو عارف الأسئلة بشكل مسبق، حتى لو طالب ضعيف هيجيب درجة كويسة. الفيصل بقى لو الطالب دخل الامتحان واتفاجئ بأسئلة أول مرة يشوفها، هنا بقى يكون التقييم حقيقي بجد. 
 
علشان كدة في علوم البيانات، بنقسم البيانات جزئين، جزء بندرب عليه النموذج، وجزء التاني النموذج عمره ما شافه قبل كدة، وده بنختبر عليه النموذج، ونشوف هيعرف يأدي كويس على الجزء اللى مشافوش قبل كدة ده ولا لا؟ لو كان أداءه جيد يبقى نجح في الاختبار وإلا فلا.
 
دول أهم فرقين من وجهة نظري، وأستاذتنا وزمايلنا ممكن يضيفوا وجهات نظرهم.

 

ليست هناك تعليقات