3-8 روش تجزیه و تحلیل اطلاعات
3-8-1 روش برآورد الگوهای رگرسیون خطی
برای برآورد این الگو معمولاً از روش کمترین مجذورات معمولی که به اختصار بهOLS معروفند، استفاده می شود. این روش ویژگی های مطلوب آماری نظیر بدون تورش بودن، بهترین برآورد کننده خطی بدون تورش یا BLUE بودن را دارا می باشند. در این روش پس از تخمین ضرایب هر یک از متغیرها در الگو، با استفاده از بکارگیری آزمونهای فرضیه نسبت به اعتبار آماری هریک از ضرایب حکم می کنیم.
3-8-2 منطق آزمون فرضیه
پس از تخمین یک الگوی رگرسیون، برای تحلیل و تفسیر اعتبار آماری ضرایب بدست آمده برای هر یک از متغیرها باید از آزمونهای آماری استفاده کرد. متداول ترین آزمون آماری در این خصوص آزمون t-test است که در آن با توجه به شکل توزیع t می توان در مورد میزان t بدست آمده و مقدار p-value مرتبط با آن برای هر یک از ضرایب قضاوت کرد. این توزیع دارای شکلی متقارن با میانگین صفر است که انحراف معیار آن برای نمونه های کوچک (30 n) کمی بیشتر از یک است. به این ترتیب شکل این توزیع کمی مسطح تر از توزیع نرمال استاندارد است. از این توزیع می توانیم برای یافتن احتمال اینکه برآورد کننده مورد نظر بین دو مقدار قرار گیرد، استفاده کنیم. برای این منظور از روش طرح فرضیات صفر و فرض مقابل آن استفاده می کنیم. معمولا فرض قابل آزمون عبارت از این حکم است که پارامتر بخصوصی از جامعه مساوی مقدار معینی است.
در نظر یه آمار چنین فرضی، فرض صفر است وبا نشان داده می شود. چرا که نشانگر آن است که تفاوتی بین مقدار واقعی پارامتر جامعه و آنچه که مفروض است، وجود ندارد. از آنجا که فرض صفر یک گزاره قابل آزمون است، باید گزاره متقابلی برای آن وجود داشته باشد (در غیر این صورت احتیاجی به آزمون نیست). گزاره مقابل، فرض مقابل نامیده می شود که ما آن را با نشان می دهیم. تعیین فرض صفر و فرض مقابل، اولین قدم در برخورد با مسائل آزمون فرض است. قدم بعدی، پیدا کرئن معیاری است که بر مبنای آن بتوان تصمیم گرفت که فرض صفر بر مبنای شواهد باید رد یا قبول شود. این معیار یا قاعده بدون در نظر گرفتن مسأله در اصل یکی است: معیار مزبور یک آماره آزمون و یک مرز برای تقسیم فضای نمونه ای به ناحیه رد و ناحیه قبول تعریف می کند. آماره آزمون صرفاً فرمولی است که چگونگی مقابله فرض را با شواهد به ما نشان می دهد. ناحیه رد، گاهی ناحیه بحرانی نیز نامیده می شود که زیر مجموعه ای از فضای نمونه ای است که اگر مقدار آماره آزمون در آن قرار گیرد، فرض صفر رد می شود. به همین ترتیب، ناحیه عدم رد که معمولا ناحیه قبول نامیده می شود، زیر مجموعه ای از فضای نمونه ای است که اگر مقدار آماره آزمون در آن قرار گیرد، فرض صفر رد نمی شود.