همایش آشنایی با رشته آمارزیستی

انجمن علمی دانشکده علوم ریاضی برگزار می کند:

به منظور آشنایی بیشتر دانشجویان با گرایش آمارزیستی، نشستی با حضور اساتید گروه آمارزیستی، گروه آمار دانشگاه فردوسی و دانشجویان این رشته ترتیب داده شده است.

مکان: دانشگاه فردوسی مشهد - دانشکده علوم ریاضی - سالن دکتر بزرگنیا

زمان: 25 آبان ماه 1388 - ساعت 12 الی 13:3

تحلیل واریانس با واریانس های نابرابر در گروه های مورد بررسی

دوست عزیزم آقای علیرضا پاک گوهر در یکی از پست های وبلاگشون به یکی از معایب روش تحلیل واریانس روتین یا همون ANOVA اشاره ای داشتند. ایشون به درستی به این نکته تاکید کردند که اگر فرض همگنی واریانس در گروه های مورد بررسی در تحلیل واریانس وجود نداشته باشه، اون وقت این روش از قابلیت اعتماد کافی برای تحلیل داده های مدنظر برخوردار نیست. بیان این نکته باعث شد تا ببینیم آیا راه حلی برای این موضوع وجود داره یا نه.

خوب ابتدا ذهنم به سمت آزمون ناپارامتری تحلیل واریانس یعنی آزمون کروسکال - والیس رفت، اما یادم اومد که این آزمون هم فرضیه ای مبنی بر همگنی واریانس در گروه های مورد بررسی داره.

بعد از اون به سراغ اینترنت رفتم و یک مطلبی در مورد تحلیل واریانس با استفاده از روش ولش (Welsh) پیدا کردم. اما با دیدنم این نام یادم افتاد که این اسم و یک جایی تو نرم افزار SPSS و SAS دیدم که با مراجعه به هر دوی این نرم افزارها دیدم که بله ...

این روش که در مواقعی که فرض همگن بودن واریانس در گروه های مورد بررسی نقض می شه به کار میرود. اگر خواستید بدونید کجا می شه این ها رو تو نرم افزار SPSS پیدا کرد، بایستی به قسمت option زیر گزینه تحلیل واریانس برید و اون جا این آزمون و پیدا خواهید کرد. البته نرم افزار SPSS یک آزمون دیگه به نام Brown- Forsythe هم معرفی کرده، که البته تو Help نرم افزار اشاره شده در صورتی که گروه های مورد بررسی هم دارای واریانس های ناهمگون و هم دارای حجم نمونه غیر یکسانی هستند، آزمون Welsh پرتوان تر عمل خواهد کرد.

در نرم افزار SAS هم شما می تونید هم در Proc ANOVA و هم در Proc GLM در قسمت دستور MEANS آزمون Welsh و پیدا کنید.

تو این سایت هم یک مقدار کوتاهی در مورد فرمول محاسباتی روش Welsh توضیح داده:

http://www.uvm.edu/~dhowell/gradstat/psych340/Lectures/Anova/anova2.html

تازه آزمون های چندگانه زمانی که فرض همگنی واریانس صادق نیست هم وجود دارند. این باشه واسه مطالب بعدی.

آزمون نرمال بودن در حالت چند متغیره

تشخیص نرمال بودن یک متغیر با استفاده از n+1 آزمون مختلف در حال حاضر در بسیاری از نرم افزارهای آماری امکان پذیر است. معروفترین و در عین حال یکی از قویترین آزمون های موجود در زمینه یک متغیره آزمون Shapiro-Wilk هست که همه باهاش آشنا هستند و تقریباً تمامی نرم افزارهای آماری این آزمون و انجام می دن.

اما در زمانی که ما با یک سری از متغیرها سر و کار داریم و می خوایم اون ها و به صورت هم زمان مورد بررسی قرار بدیم بایستی از روش های چندمتغیره پیوسته (در صورت پیوسته بودن متغیرها) استفاده کنیم. تقریباً بیشتر روش های آماری چند متغیره مبنی بر فرض نرمال بودن بردار متغیرها است.

حالا این جا این سوال مطرح می شه که چطور می تونیم فرض نرمال بودن رو در حالت چند متغیره بسنجیم.

در نظریه اگر تعدادی متغیر داشته باشیم که توزیع چند متغیره اون ها نرمال باشه، اون وقت هم تک تک متغیرها و هم هر ترکیب خطی از اون متغیرها دارای توزیع نرمال خواهد بود، اما بالعکس این موضوع صادق نیست. یعنی ممکن همه متغیرهای موجود دارای توزیع نرمال باشند، اما توزیع همزمان یا چند متغیره اون ها نرمال نباشه که این مثال نقض و مباحث مرتبط با اون در کتاب روش های چندمتغیره جانسون آورده شده.

اما در عمل اون چیزی که انجام میشه این که می یایم فرض نرمال بودن تک تک متغیرها رو بررسی می کنیم و اگر همشون نرمال بودن رای به نرمال بودن توزیع چندمتغیره اون ها می دیم که این موضوع به لحاظ نظری (همون طور که گفتم) دچار نقص هست.

حالا چی کار کنیم؟

من خودم دنبال این موضوع بودم و بالاخره تونستم آزمون تعمیم یافته Shapiro-Wilk و در حالت چند متغیره پیدا کنم. این آزمون و شما می تونید در نرم افزار R با استفاده از Package به نام mvShapiroTest انجام بدید.

این آزمون بر اساس مقاله زیر ساخته شده:

Villasenor-Alva, J.A. and Gonzalez-Estrada, E. (2009). A generalization of Shapiro-Wilk’s test for multivariate normality. Communications in Statistics: Theory and Methods,38 11,1870-1883.

اگر خواستید این آزمون و در عمل استفاده کنید می تونید از آدرس زیر Package مربوطه و دانلود کنید:

http://cran.um.ac.ir/web/packages/mvShapiroTest/index.html

بعد هم به قول معروف حالش و ببرید

(فقط این نکته رو بگم که چندتا آزمون دیگه هم تو این زمینه هست، اما فعلاً این یکی رو داشته باشین تا بعد)