رگرسیون خطی ساده Linear Regresion spss

پژوهشکده مجازی آمار - رگرسیون خطی ساده
  1. رگرسیون خطی ساده

در رگرسیون خطی ساده همانطور که گفته شد یک متغیر مستقل و یک متغیر وابسته داریم و به دنبال بررسی رابطه بین متغیر وابسته و مستقل هستیم . قبل از بررسی رابطه بین متغیر وابسته و متغیر مستقل ، ابتدا باید بررسی کنیم آیا رابطه معنی داری بین این دو متغیر وجود دارد یا خیر ؟ برای این منظور از ابزاری بنام نمودار پراکنش استفاده می کنیم . اگر در این نمودار نقاط کاملا پراکنده باشند و در یک امتداد قرار نگیرند ، به معنای عدم وجود رابطه بین دو متغیر بوده و عملا رگرسیون کاربردی نخواهد داشت و نمی توان از آن استفاده کرد و خط رگرسیونی برازش داد . اما در صورتیکه در نمودار پراکنش ، نقاط طوری در امتداد یکدیگر قرار گیرند  که گویی حول یک خط متمرکز شده اند ، نشان دهنده وجود رابطه بین متغیرهاست و می توان خطی را که از میان نقاط می گذرد و نزدیک ترین خط ممکن به نقاط باشد را به عنوان خط رگرسیون در نظر گرفت . کاربرد خط رگرسیون تخمین زدن متغیر وابسته به کمک مقدار متغیر مستقل و معادله ی خط رگرسیون می باشد . البته مقادیر پیش بینی شده ی متغیر وابسته به دست آمده از معادله  رگرسیونی ممکن است با مقادیر واقعی کاملا برابر نباشند و مقداری اختلاف وجود داشته باشد . این اختلاف ها بین مقادیر واقعی و مقادیر پیش بینی شده در واقع همان مانده ها ( Residual  ) هستند .

در رگرسیون خطی ساده متغیر وابسته را y و متغیر مستقل را x می نامیم در اینصورت معادله خط رگرسیون چنین خواهد بود :

 

 y' مقدار برآورد شده ی  y ، b0  عرض از مبدا یا همان ضریب ثابت رگرسیونی است و x  نیز مقدار متغیر مستقل می باشد .

مانده ها ( Residual  )

همانطور که در بالا توضیح داده شد ، با استفاده از معادله ی خط رگرسیون به ازای مقادیر مختلف متغیر مستقل (x) مقادیری برای متغیر وابسته (y) به دست خواهند آمد که این مقادیر برآورد شده با مقادیر حقیقی مقداری اختلاف دارند . یعنی مقادیر برآورد شده ی متغیر وابسته دقیقا بر مقادیر مشاهده شده منطبق نخواهند بود . اختلاف بین مقادیر مشاهده شده و مقادیر حقیقی در پیش بینی همان مانده یا خطاست که با ei  نشان داده می شود :

در مدل های رگرسیونی می بایست مانده ها را بررسی کنیم چرا که مانده ها شاخصی برای آزمودن صحت معادله ی خط رگرسیونی برآورد شده می باشند .

شرایط رگرسیونی خطی ساده

در رگرسیون خطی ساده باید شرایط زیر برقرار باشند :

  1. توزیع خطاها ( مانده ها ) نرمال باشند یعنی :

الف ) امید ریاضی ( میانگین ) خطاها  برابر با صفر و واریانس خطاها نیز ثابت باشد :

            ,            Var(ei)=δ2

  1. همبستگی بین خطاها وجود نداشته باشد.                               
  2. متغیر وابسته از توزیع نرمال پیروی کند .
  3. بین متغیرهای مستقل همبستگی معناداری وجود نداشته باشد ( متغیرهای مستقل دارای هم خطی نباشند) .

ضریب همبستگی چندگانه

به ازای هر مقدار مشاهده شده x  ایی ( متغیر مستقل ) که در معادله خط رگرسیون قرار  می دهیم ، یک مقدار  y  (متغیر وابسته) به دست می آید . همبستگی مقدار برآورد شده y' با مقدار مشاهده شده (y) در نمونه شاخصی است که کارایی رگرسیون در پیش بینی  y  را نشان می دهد . این همبستگی بین مقدار برآورد شده و مقدار مشاهده شده را ضریب همبستگی  همان قدرمطلق ضریب همبستگی پیرسن بین متغیر مستقل (x و ) و متغیر وابسته (y) می باشد که همواره عددی است مثبت . در ادامه با مثالی روند رگرسیون خطی ساده را شرح می دهیم .

فرض کنید می خواهیم رابطه بین شتاب خودرو و مصرف سوخت را بررسی کنیم و از این رابطه یک الگوی خطی ساخته و سپس از این الگو برای پیش بینی مصرف سوخت خودرو به ازای شتاب های مختلف استفاده کنیم . داده های زیر شتاب خودرو و مصرف سوخت را نشان می دهند .

8.5

10

8.5

9

10

10.5

12

11

11.5

12

شتاب

15

14

14

14

15

17

16

18

15

18

سوخت مصرفی

 

 

 

 

 

الف ) نمودار پراکنش را رسم کنید .

ب ) معادله خط رگرسیونی را بنویسید .

پ ) شرایط اساسی رگرسیون را بررسی کنید .

ابتدا داده ها را وارد کنید :

پژوهشکده مجازی آمار - ورود دیتا در رگرسیون خطی ساده

 سپس برای رسم نمودار پراکنش داده ها مسیر زیر را دنبال کنید :

Graphs / Legacy Dialogs / Interactive / Scatterplots

  • پس از اجرای فرمان بالا در کادر محاوره  Create Scatterplots و در قسمت Assign Variable  متغیر mpg ( میزان مصرف سوخت وسیله ی نقلیه ) را به محور عمودی و متغیر شتاب ( accel ) را به محور افقی انتقال می دهیم .

پژوهشکده مجازی آمار - رسم نمودار پراکنش در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • در برگه fit  وارد قسمت  Method  شده و از منوی کشویی باز شده گزینه Regression  را انتخاب می کنیم .
  • در همین برگه دقت کنید گزینه  include constant in equation  جهت بودن مقدار ثابت در معادله رگرسیون ، دارای تیک انتخاب باشد .

پژوهشکده مجازی آمار - انتخاب مدا در رسم نمودار پراکنش در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

 

 

پس از طی مراحل ذکر شده نمودار زیر نمایش داده خواهد شد :

پژوهشکده مجازی آمار - نمودار پراکنش در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

به نمودار و مقدار ضریب همبستگی دقت کنید . این دو نشان می دهند که رابطه ای خطی بین دو متغیر وجود دارد و می توان رابطه بین آنها را به صورت یک خط بیان کرد ( می توان معادله خط برازش داد ) . برای یافتن معادله چنین خطی از رگرسیون خطی ساده استفاده می کنیم . جهت اجرای رگرسیون خطی ساده مسیر زیر را دنبال می کنیم :

Analyze / Regression / Linier

پژوهشکده مجازی آمار - کادر محاوره رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

  • در کادر محاوره باز شده متغیر mpg  ( میزان مصرف سوخت )  را به کادر متغیر وابسته و متغیر   accele   ( شتاب ) را به کادر متغیر ( های ) مستقل منتقل می کنیم .
  • گزینه  statistics  را انتخاب می کنیم تا کادر محاوره زیر باز شود :

پژوهشکده مجازی آمار - محاسبه آماره ها در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

در کادر محاوره باز شده گزینه های تیک خورده در عکس بالا را انتخاب کنید و سپس گزینه  Continue را کلیک کنید تا به کادر محاوره اصلی برگردید . در کادر محاوره اولیه گزینه  plots  را انتخاب کنید :

پژوهشکده مجازی آمار - کادر محاوره محاسبه و رسم نمودار مانده ها در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

پس از آن گزینه  Continue را کلیک کنید تا به کادر محاوره اصلی برگردید . پس از بازگشت به کادر محاوره اصلی گزینه  Continue را کلیک کنید تا خروجی های حاصل از اجرای روند رگرسیون خطی ساده نمایش داده شوند .

 

پژوهشکده مجازی آمار - خلاصه مدل در خروجی رگرسیون خطی ساده

 

 

 

 

 

 

پژوهشکده مجازی آمار - رگرسیون خطی ساده

 

 

 

 

مقدار ضریب تعیین برابر با 0.447 می باشد .  

 

پزوهشکده مجازی آمار - خروجی رگرسیون خطی ساده

 

 

 

 

 

پس از رسم نمودار پراکنش و اطمینان یافتن از وجود رابطه بین دو متغیر می بایست اعتبار رگرسیون را بسنجیم و برای این منظور آزمون زیر را انجام می دهیم :

 

 اگر در یک مدل رگرسیونی 0=β باشد ، مدل رگرسیون معتبر نخواد بود . در واقع 0=β بدترین حالت ممکن یک خط رگرسیونی است .با توجه به مقدار سطح معنی داری آزمون اعتبار رگرسیون (sig.=0.034<0.05)  فرض صفر رد شده و شیب خط رگرسیون (β)  مخالف صفر می باشد و در نتیجه مدل رگرسیونی معتبر است .

پژوهشکده مجازی آمار - جدول ضرایب رگرسیونی در خروجی رگرسیون خطی ساده

 

 

 

 

 

در جدول بالا ضرایب رگرسیونی و آزمون های اعتبار سنجی این ضرایب را مشاهده می کنید با استفاه از جدول بالا و با توجه به سطوح معنی داری معادله خط رگرسیون به صورت زیر می باشد :

پژوهشکده مجازی آمار - جدول مانده ها در رگرسیون خطی ساده

 

 

 

 

در جدول Residuals Statistics آماره های مربوط به باقی مانده ها و مقادیر پیش گویی شده نمایش داده شده اند .

پژوهشکده مجازی آمار - نمودار بررسی نرمال بودن خطاها در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

نمودار فوق فرض نرمال بودن خطاها را بررسی می کند و همانطور که ملاحظه می کنید خطاها نرمال هستند .

پژوهشکده مجازی آمار - نمودار باقی مانده ها در رگرسیون خطی ساده

 

 

 

 

 

 

 

 

 

 

 

 

آخرین نمودار ، (نمودار  Scatterplot) نموداری است که باقی مانده ها را در مقابل مقادیر پیش بینی رسم می کند . با توجه به اینکه روندی در بین این داده ها مشاهده نمی گردد نتیجه میگیریم که خطاها واریانس ثابت دارند که مطلوب ماست و از شروط مورد نیاز رگرسیونی است .

 

 

 

لینک کوتاه شده محتوی: https://digitdata.ir/node/34

دیدگاه‌ها

Cood and Valuaable

امیدوارم این آموزش برای شما مفید واقع شده باشد

افزودن دیدگاه جدید

Filtered HTML

  • نشانی صفحه‌ها وب و پست الکترونیک بصورت خودکار به پیوند تبدیل می‌شوند.
  • تگ‌های HTML مجاز: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • خطوط و پاراگراف‌ها بطور خودکار اعمال می‌شوند.

Plain text

  • تگ‌های HTML مجاز نیستند.
  • نشانی صفحه‌ها وب و پست الکترونیک بصورت خودکار به پیوند تبدیل می‌شوند.
  • خطوط و پاراگراف‌ها بطور خودکار اعمال می‌شوند.
Image CAPTCHA
Enter the characters shown in the image.