۱-۱۷ |
کمترین مقدار را داشته باشد. مساله رگرسیون چندکی با بهره گرفتن از برنامهنویسی خطی زیر حل می شود:
که ماتریس طرح است.(Koenker، ۲۰۰۵)
مثال ۱-۲
برای اینکه رابطه بین درآمد استادان دانشگاه و تعداد سالهایی که آنها به عنوان استاد مشغول به کار بودند مشخص شود، ۴۵۹ داده مربوط به حقوق استادان آمار آمریکا و تعداد سالهایی که هر کدام به عنوان استاد بین سالهای ۱۹۸۰ تا ۱۹۹۰، مشغول به کار بوده اند جمعآوری شده است. مدل رگرسیونی خطی استاندارد برای این داده ها به صورت زیر است:
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
که میزان درآمد، تعداد سالهای استاد بودن و خطای مدل است. فرض می شود خطاها مستقل هستند و توزیع نرمال دارند. با توجه به نمودار پراکندگی داده ها، به نظر میرسد مناسبتر است از مدل پیچیدهتری مانند مدلهای رگرسیونی چند جملهای استفاده شود. در شکل زیر،داده ها به همراه بهترین نمودار رگرسیونی درجه دوم
رسم شده است.
شکل ۱-۲
با توجه به شکل بالا، منحنی رگرسیون تصویر روشنی از توزیع حقوق نشان نمیدهد زیرا تغییرات شکل توزیع حقوق نسبت به سالهای استادی به خوبی نشان داده نشده است. دلیل این موضوع این است که رگرسیون استاندارد، مدلهایی را برازش میدهد که نشان دهنده ارتباط بین میانگین حقوق و سالهای استادی است.
برای نشان دادن کاملتر این ارتباط، در شکل زیر چارکهای شرطی میزان حقوق برای
به عنوان تابعی از سالهای استادی رسم شده است.
شکل ۱-۳
نمودارهای حاصل را نمودارهای رگرسیون چندکی گویند. با توجه به این نمودارها تغییر در میزان حقوق بهتر نشان داده شده است.
فصل دوم
دورهنگارهای لاپلاسی
۲-۱ مقدمه
رگرسیون کمترین قدر مطلق انحرافات (LAD) یک روش شناخته شده در تحلیل داده ها است که تاریخ آن به بیش از دو قرن پیش باز میگردد. در سالهای اخیر و با پیشرفت روشهای محاسباتی، به ویژه الگوریتمهای برنامه نویسی خطی، رگرسیون کمترین قدر مطلق انحرافات بار دیگر توجه محققان در زمینه های تئوری و عملی را به خود جلب کرده است. در سال۲۰۰۵،Koenker در کتابی به بررسی تاریخچه، پیشرفتهای اخیر در رگرسیون کمترین قدر مطلق انحرافات و تعمیمهای این روش به روش رگرسیون چندکی پرداخته است. روش کمترین قدر مطلق انحرافات به دلیل پایا بودن در برابر وجود داده های پرت از اهمیت خاصی برخوردار است و خواص آماری برآوردگرهای کمترین قدر مطلق انحرافات در روشهای رگرسیون خطی و غیر خطی به صورت گستردهایی مورد مطالعه قرار گرفته است. برای اطلاعات بیشتر میتوانید به Bloomfield و Steiger (1983)، Breidtو Davis و Trindate (2001)، Dodge (1997 و ۲۰۰۲) ، Dielman (2005)، Koenker (2005) و Lai و Lee (2005) رجوع کنید.
در این فصل به کاربردی از رگرسیون کمترین قدر مطلق انحرافات در تحلیل سریهای زمانی اشاره کرده و به طور خاص با بهره گرفتن از این روش به تحلیل وابستگیهای پیاپی در داده های سری زمانی میپردازیم. بدین منظور، در رگرسیون همساز، روش کمترین مربعات را با روش کمترین قدر مطلق انحرافات جایگزین میکنیم که نتیجه آن معرفی تابعی مشابه با دورهنگارها است که از آن با عنوان دورهنگار لاپلاسی یاد خواهیم کرد.
در ادامه نشان داده خواهد شد که همانگونه که توزیع مجانبی دورهنگار وابسته به طیف خود همبستگی است، توزیع مجانبی دورهنگارهای لاپلاسی به صورت مستقیم وابسته به مفهومی است که طیف گذر صفر نامیده می شود.گذرهای از صفر به دلیل دارا بودن اطلاعاتی غنی در مورد وابستگیهای سری زمانی مفاهیمی شناخته شده بوده و از کاربرد وسیعی در زمینه تحلیل سیگنال برخوردار هستند (Kedem ( 1994)). ارتباط دورهنگار لاپلاسی با طیف گذر از صفر دلیلی منطقی برای استفاده از این دورهنگار را در تحلیل سریهای زمانی فراهم می آورد.
۲-۲ دورهنگار لاپلاسی[۱۷]
همانطور که در فصل اول اشاره شد، برای سری زمانی با طول و فرکانس دلخواه در بازه دورهنگار به صورت زیر تعریف می شود:
که در آن است. علاوه بر آن نشان داده شد که برای فرکانسهای فوریه ، که عددی صحیح است، دورهنگار را با توجه به رگرسیون همساز میتوانیم به صورت زیر بازنویسی کنیم:
۲-۱ |
که در آن از رگرسیون کمترین مربعات (LS) و از رابطه زیر بدست آمده و رگرسور همساز به صورت تعریف می شود: