دانشگاه شیراز
دانشکده علوم
پایان نامه ی کارشناسی ارشد در رشته ی آمارریاضی
برآوردیابی پارامترهای یک مدل خطی برای داده های سانسورشده
اساتید راهنما
دکتر مینا توحیدی
دکتر عبدالرسول برهانی
آذر ماه1392
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
فهرست مطالب
عنوان صفحه
فصل اول:تعاریف و مقدمات اولیه
1.1 مدل خطی………………………………………………………………………………………………………………………………………………….. 1
2.1 انواع برآوردگرهای استوار……………………………………………………………………………………………………………………………. 5
1.2.1 برآورد M………………………………………………………………………………………………………………………………………………. 5
3.1 آنالیز بقا………………………………………………………………………………………………………………………………………………………. 6
1.3.1 برآوردگر کاپلان مایر…………………………………………………………………………………………………………………………….. 7
2.3.1 سانسور………………………………………………………………………………………………………………………………………………….. 9
4.1 مدل رگرسیون خطی با خطای اندازهگیری…………………………………………………………………………………………….. 14
فصل دوم : دادهای سانسور شده از راست و مدل های رگرسیونی
1.2 مقدمه و تاریخچه……………………………………………………………………………………………………………………………………… 21
2.2 برآوردگر Susarla _Van Ryzin_ Koul……………………………………………………………………………………….. 22
1.2.2 مزایایی و معایب برآوردگر KSV……………………………………………………………………………………………………… 24
3.2 اصلاحات و تعمیم های برآوردگر KSV…………………………………………………………………………………………………. 25
1.3.2 تبدیل های دیگر………………………………………………………………………………………………………………………………… 25
2.3.2 اصلاحات برآوردگر KSV…………………………………………………………………………………………………………………. 26
1.2.3.2 طبقه بندی…………………………………………………………………………………………………………………………………… 26
2.2.3.2 برآورد M……………………………………………………………………………………………………………………………………… 27
4.2 تحلیل باقیمانده……………………………………………………………………………………………………………………………………….. 29
5.2 مثال………………………………………………………………………………………………………………………………………………………….. 30
فصل سوم : برآورد مدل مدل های خطی خطا با داده های سانسور شده
1.3 مقدمه……………………………………………………………………………………………………………………………………………………….. 37
2.3 . مدل رگرسیون خطی با دادههای سانسور شده با وجود خطا در متغیرهای مستقل…………………………… 40
1.2.3 اصلاح روش حداقل مربعات……………………………………………………………………………………………………………….. 41
2.2.3 روش درستنمایی تجربی وساخت فاصله اطمینان…………………………………………………………………………….. 45
4.3 اثبات قضایا……………………………………………………………………………………………………………………………………………….. 50
فصل چهارم :مطالعات شبیه سازی
1.4 حالت یک بعدی………………………………………………………………………………………………………………………………………….. 6
پیوست
برآوردگر کاپلان مایر با وجود دادههای سانسور شده……………………………………………………………………………………… 66
نسبت لگاریتم درستنمایی تجربی…………………………………………………………………………………………………………………… 67
معرفی نمادهای و ……………………………………………………………………………………………………………….. 70
واژه نامه
واژه نامه انگلیسی-فارسی………………………………………………………………………………………………………………………………… 72
وژه نامه فارسی-انگلیسی…………………………………………………………………………………………………………………………………. 77
مراجع…………………………………………………………………………………………………………………………………………………………………. 82
فهرست جداول
عنوان صفحه
جدول شماره 2.1: مجموع مربعات باقیمانده……………………………………………………………………………………………………. 31
جدول شماره 2.2: مجموع مربعات باقیمانده…………………………………………………………………………………………………… 34
جدول شماره 3.2: ضرائب برآورد شده (برای مدل کامل)………………………………………………………………………………. 35
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش NA برای ……………………………. 62
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش AEL برای …………………………. 63
فهرست شکلها
عنوان صفحه
شکل شماره 1.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش درجه دوم………………………. 20
شکل شماره 2.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش خطی…………………………….. 21
فصل اول:
مقدمات
در این فصل تعاریف و مقدمات اولیه برای مدلهای خطی، مدلهای خطی با خطای اندازهگیری، برآوردگرهای استوار بهویژه برآورد M، آنالیز بقا، برآوردگر کاپلان مایر، دادههای سانسورشده و انواع سانسور ارائه میشود.
1-1- مدل خطی
یکی از کاربردیترین روشها برای تحلیل دادهها در بین ابزارهای آماری، تحلیل رگرسیونی است. تحلیل رگرسیونی،روشی کارآمد برای بررسی و مدلسازی ارتباط بین متغیرها است که از این مدل های رگرسیونی در توصیف دادهها، برآورد پارامترهای مجهول، پیشگویی و کنترل استفاده می شود.
در بیشتر موارد، پاسخ یک آزمایش به چندین متغیر مستقل مثلا k متغیر مستقل، وابسته است. در این صورت یک مدل خطی رابطهای به صورت زیر را در نظر میگیرد:
که n اندازه نمونه میباشد. متغیرهای را متغیرهای توضیحی و متغیر تصادفی قابل مشاهده y را متغیر پاسخ مینامند.
متغیر تصادفی غیرقابل مشاهده متغیر خطا تلقی میشود، بدین معنی که به عنوان متغیری تصادفی، انداره ناتوانی مدل در برازش دقیق دادهها را اندازهگیری میکند. این خطا ممکن است به دلیل عدم حضور برخی از متغیرهای مؤثر، خطاهای تصافی مربوط به مشاهدات و اندازهگیریها و غیره صورت پذیرد.
همچنین فرض میشود که خطاها دارای توزیع نرمال با میانگین صفر و واریانس نامعلوم و ناهمبسته باشند.
پارامترهای و مجهول هستند و باید با استفاده از دادهها برآورد شوند. فرض میشوددادهها عبارتند از که در آن پاسخ متناظر با k سطح از متغیرهای مستقل است. یعنی بنابر معادله (1.1.1) میتوان نوشت:
آنگاه هدف ما به دست آوردن برآوردهای برای به ترتیب به نامهای و در نتیجه به دست آوردن رابطه زیر است.
که در آن نشان دهنده مقدار برآورد شده y به ازای مقادیر است. در این صورت معادله (3.1.1) به عنوان معادله پیش بینی کننده میتواند مورد استفاده قرار گیرد.
معمولترین روش در برآورد پارامترهای یک مدل خطی، استفاده از روش “کمترین مربعات معمول (OLS)” است که روشی بسیار سودمند و کارا است.
پایه و اساس روش کمترین مربعات به Gaussو Legendreباز میگردد. این روش (و تعمیمهای آن ) به دلیل راحتی محاسبات و جوابهای بسته مبتنی برآن مورد توجه بسیاری از آماردانان است.
برآوردهای را به گونهای برمیگزینیم که مجموع توان دوم انحرافها را کمینه کند، یعنی آنها را به گونهای به دست میآوریم که در معادله زیر هنگامی که به ترتیب جایگزین میشوند، کمترین مقدار ممکن را تولید کنند.
برآوردهای با مشتق گرفتن از معادله (4.1.1) نسبت به و مساوی صفر قرار دادن آنها به دست میآیند. ملاحظه میشود که برای حل این معادله های نرمال بهتر است که از روش ماتریسی استفاده شود. می توان رابطه (1.1.1) را به فرم ماتریسی زیرر در نظر گرفت.
بطوریکه .
فرم ماتریسی را میتوان بصورت زیر نوشت.
این مدل را یک مدل خطی گویند، زیرا نسبت به پارامترهای مدل، خطی است.
در این مدل خطی Yیک ماتریس ، X یک ماتریس ، یک ماتریس و یک ماتریس هستند.
آنگاه میتوان معادلههای نرمال را به صورت زیر نوشت:
زیرا
چون یک ماتریس است در نتیجه با ترانهاده خود برابر است پس:
و خواهیم داشت:
با مشتق گرفتن از رابطه (7.1.1) نسبت به بردار و جایگزین کردن به جای و مساوی صفر قرار دادن آن، معادلههای نرمال (6.1.1) به دست میآیند.
ماتریسهای و عبارتند از:
با فرض معکوسپذیر بودن ماتریس داریم:
که در این صورت معادله پیش بینی کننده عبارت است از:
که در آن داریم:
اما زمانی که داده پرت داشته باشیم روش کمترین مربعات معمولی جوابگو نیست، به همین دلیل به معرفی برآوردگرهای استوار می پردازیم.
1-2- انواع برآوردگرهای استوار:
برآوردگرهای استوار برآوردهایی هستند که با استفاده از آنها میتوان حساسیت روش حداقل مربعات را نسبت به وجود دادههای پرت کاهش داد.
برای این منظور روش کمی زیر را معرفی میکنیم:
میتوان را توسط تابع دیگری مانند جایگزین کرد. و با کمینه کردن به برآوردگری استوار دست یافت. برآوردهای ، برآوردهای M و برآوردهای GM با این روش حاصل میشوند. که در این پایان نامه فقط به معرفی برآورد M میپردازیم.
تذکر. جایگزین کردن مجموع یا میانگین با کمیتهای استوار نظیر آنها مانند میانه یا میانگین پیراسته است. بر این اساس، روشهایی تحت عنوان LMS (کمترین میانه مربعات) یا LTS (کمترین میانگین پیراسته مربعات) معرفی شدهاند.
1-2-1- برآوردM
میتوان در رابطه ی به جای توابع دیگری مانند را قرار داد و برآوردهای پارامترها را بهگونهای یافت که کمیت زیر حاصل شود.
که یک تابع حقیقی با ویژگیهای زیر است:
الف.
ب. تابع متقارن است.
ج. تابع پیوسته است.
د. اگر آنگاه است.
ه. فرض کنید باشد، آنگاه است.
و. اگر و ، آنگاه است.
تذکر. میباشد.
تعداد صفحه :99
قیمت : 14700تومان
بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد
و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.
پشتیبانی سایت : **** serderehi@gmail.com
در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.
*** **** ***
[add_to_cart id=148823]