آزمون نرمال بودن در حالت چند متغیره
تشخیص نرمال بودن یک متغیر با استفاده از n+1 آزمون مختلف در حال حاضر در بسیاری از نرم افزارهای آماری امکان پذیر است. معروفترین و در عین حال یکی از قویترین آزمون های موجود در زمینه یک متغیره آزمون Shapiro-Wilk هست که همه باهاش آشنا هستند و تقریباً تمامی نرم افزارهای آماری این آزمون و انجام می دن.
اما در زمانی که ما با یک سری از متغیرها سر و کار داریم و می خوایم اون ها و به صورت هم زمان مورد بررسی قرار بدیم بایستی از روش های چندمتغیره پیوسته (در صورت پیوسته بودن متغیرها) استفاده کنیم. تقریباً بیشتر روش های آماری چند متغیره مبنی بر فرض نرمال بودن بردار متغیرها است.
حالا این جا این سوال مطرح می شه که چطور می تونیم فرض نرمال بودن رو در حالت چند متغیره بسنجیم.
در نظریه اگر تعدادی متغیر داشته باشیم که توزیع چند متغیره اون ها نرمال باشه، اون وقت هم تک تک متغیرها و هم هر ترکیب خطی از اون متغیرها دارای توزیع نرمال خواهد بود، اما بالعکس این موضوع صادق نیست. یعنی ممکن همه متغیرهای موجود دارای توزیع نرمال باشند، اما توزیع همزمان یا چند متغیره اون ها نرمال نباشه که این مثال نقض و مباحث مرتبط با اون در کتاب روش های چندمتغیره جانسون آورده شده.
اما در عمل اون چیزی که انجام میشه این که می یایم فرض نرمال بودن تک تک متغیرها رو بررسی می کنیم و اگر همشون نرمال بودن رای به نرمال بودن توزیع چندمتغیره اون ها می دیم که این موضوع به لحاظ نظری (همون طور که گفتم) دچار نقص هست.
حالا چی کار کنیم؟
من خودم دنبال این موضوع بودم و بالاخره تونستم آزمون تعمیم یافته Shapiro-Wilk و در حالت چند متغیره پیدا کنم. این آزمون و شما می تونید در نرم افزار R با استفاده از Package به نام mvShapiroTest انجام بدید.
این آزمون بر اساس مقاله زیر ساخته شده:
Villasenor-Alva, J.A. and Gonzalez-Estrada, E. (2009). A generalization of Shapiro-Wilk’s test for multivariate normality. Communications in Statistics: Theory and Methods,38 11,1870-1883.
اگر خواستید این آزمون و در عمل استفاده کنید می تونید از آدرس زیر Package مربوطه و دانلود کنید:
http://cran.um.ac.ir/web/packages/mvShapiroTest/index.html
بعد هم به قول معروف حالش و ببرید
(فقط این نکته رو بگم که چندتا آزمون دیگه هم تو این زمینه هست، اما فعلاً این یکی رو داشته باشین تا بعد)
من احسان صباغيان، دانشجوی دکتری در زمینه بیوانفورماتیک هستم. علاقه مند به مباحث كاربردي آمار در علوم مختلف، به خصوص پزشكي و ژنتیک.