ژنتیک و دنیایی دیگر

واقعاً این علم ژنتیک و شاخه‌های مرتبط با اون چقدر جذاب و جالب‌اند. من که تازه شروع کردم به خوندن مطالبی در مورد عالم کروموزم‌ها و ژن‌ها و هنوز چیز زیادی در این مورد نمی‌دونم مجذوب این دنیای پیچیده و منظم شدم. دلیل این‌که دارم در مورد ژنتکی مولکولی یه کمی مطلب می‌خونم به خاطر آشنایی با این زمینه است تا بتونم یک سرکی هم به بحث ژنتیک آماری و بیوانفورماتیک بزنم و ببینم این دانشمندان گرامی که قرن 21 و قرن ژنتیک نامگذاری کردن چی دیدن که این طوری مجذوبش شدن که در همین نگاه اول حق و به اون‌ها می‌دم و می‌گم که واقعاً هم درست گفتن.

راستی نمی‌دونید چقدر سخت خوندن این کتاب‌های مرتبط با زیست‌شناسی اعم از ژنتیک مولکولی و ... . خوب خودتون بهتر می‌دونید که ما آماری‌ها هم تو دبیرستان ریاضی خوندیم هم تو دوره لیسانس همش با ریاضیات سر و کار داشتیم و به همین خاطر سر و کله زدن با این مفاهیم جدید و اسامی مشابه زیاد کار می‌بره. البته برای حل این مشکل یک کتاب جالب پیدا کردم که خوراک ماهاست که اصلاً تو زمینه زیست و شیمی چیزی حالیمون نیست. اسم اصلی این کتاب ‘The Cartoon Guide to Genetics’ که به فارسی "راهنمای مصور ژنتیک" ترجمه شده. این کتاب 213 صفحه‌ای با استفاده از کاریکاتورها و اشکال مختلف و جالب و با یک روش بسیار ساده تمامی مفاهیم اولیه ژنتیک مولکولی و به هر انسانی منتقل می‌کنه. اگر شما هم مثل من از زیست شناسی چیزی نمی‌دونید و می‌خواید در این زمینه اطلاعاتی کسب کنید توصیه می‌کنم حتماً این کتاب و ببنید. راستی یک کتاب مشابه (یعنی با کاریکاتور و اشکال جالب) در زمینه آمار و احتمال هم هست که به فارسی هم ترجمه شده. اسم این کتاب ‘The Cartoon Guide to Statistics’ که عنوان فارسی تعیین شده برای اون هست "آموزش آمار و احتمال به کمک کاریکاتور" این هم کتاب بسیار جالبی.

در انتها قصد دارم هم سال نو و به همه تبریک بگم و هم این‌که می‌خوام یکم بیشتر در مورد ژنتیک و مسائل مرتبط با اون براتون بگم.

پتویی به نام ...

نمی‌دونم چرا، ولی متاسفانه یک واقعیت تلخی میان ما آماری‌ها (اکثریت قریب به اتفاق) وجود داره این که نمی‌تونیم یا بهتره بگم نتونستیم هنوز این دیدگاه ریاضی‌گونه خودمون رو از آمار بر داریم تا بذاریم این رشته تو این مملکت یکم توسط خود آماری‌ها پیشرفت کنه.

متاسفانه ما آماری‌ها سرمون و کردیم زیر یک پتویی و داریم با هم دیگه در مورد آمار صحبت می‌کنیم و هر کس دیگه‌ای هم که بخواد خارج از زیر این پتو در مورد آمار با ما صحبت کنه سریع ردش می‌کنیم و بهش می‌گیم تو از آمار چیزی نمی‌فهمی.

در صورتی که تمامی اتفاقات مثبتی که در مورد آمار داره تو این جامعه می‌افتده خارج از بیرون از اون پتویی که همه کلمون و کردیم زیرش.

بذارین به صورت عینی واستون بگم که نگین حرفاش بی دلیله.

یک نگاهی به دور و برتون بکنین و بعد بگید در چند جا تو این مملکت دید که از آمار استفاده علمی در عمل بشه. همه می‌دونیم که جواب این سوال واضحه، خیلی کم. حالا از این خیلی کم رو چندتاش و آماری‌ها انجام دادن. اگر از من بپرسین می‌گم هیچی. چرا؟

به صنعت نگاه کنین، بچه‌های مهندسی صنایع دارند از آمار استفاده می‌کنند اون هم به بهترین نحو ممکن. نگید که اون‌ها از آمار چیزی نمی‌دونن که نشون دهنده بی‌اطلاعایی شما از بازار کار. چرا که اگر اون‌ها از آمار چیزی نمی‌دونین پس چطور تونستن خودشون رو تو بخش خصوصی که با هیچ کسی شوخی نداره نگهدارند. اون‌ها خیلی خوب از آمار سر در می‌یارند بدون این‌که مثل ما آماری‌ها بهترین برآوردگرها یا نمی‌دونم کران پایین نامساوی کرامر رائو بتونن به دست بیارن، اون‌ها فقط مشکلشون این‌که سرش مثل ما زیر اون پتوی نیست

برید تو زمینه اقتصاد. می‌تونید کسی از آماردانان این مرز و بوم و برام مثال بزنید که الان داره در زمینه اقتصاد از آمار استفاده می‌کنه. اگر می‌شناسید حتماً به من هم معرفی کنید. دقت کنید که منظورم از آماردان همون افرادی هستند که سرشون زیر پتوی و می‌گن فقط ما آمار و می‌فهمیم نه شمایی که فقط بلدی ازش استفاده کنی.

در زمینه داده‌کاوی. بچه‌های صنایع و کامپیوتر این زمینه و در اختیار خودشون گرفتن. حق هم دارند. دارن از این روش‌ها در عمل استفاده می‌کنن. نتایجش و تو جامعه و صنعت نشون می‌دن نه مثل ما آماری‌ها نیستند که کارامون از روی کاغذ و تخته سیاه جایی فراتر نمی‌ره.

نمی‌خوام زیاد کشش بدم واسه همین فقط یک مثال دیگه می‌زنم که به رشته خودم هم ارتباط داره.

همین چند وقت پیش یکی از دانشجویان PhD پرستاری اومد و برامون از فرا تحلیل گفت (Meta-Analysis) و چقدر هم جالب گقت. بدون این‌که بخواد واسمون از ریشه و بنیاد فرمول‌هاش بگه. اومد و در مورد کاربردش گفت و الان که دارم با شما صحبت می‌کنم همین آقا چندین مقاله کاربردی در این زمینه کار کرده که تو جاهای معتبر هم چاپ شده.

حالا اگر یک آماری بخواد بره در زمینه فرا تحلیل کار کنه تو همون برآورد اندازه اثر و توزیع نمونه‌ای آماره و این‌که چرا در سیگماهای نوشته شده از اندیس i استفاده نشده و یا چرا به جای S بزرگ از s کوچیک استفاده شده خواهد ماند و فکر می‌کنه که داره فراتحلیل یاد می‌گیره. و بعد به دیگرانی که از این روش استقاده کرده‌اند و مشکلی از مشکلات این جامعه و حل کردن خورده می‌گیره که آقا شما از آمار چیزی نمی فهمی. ولی متاسفانه باید به این فرد گفت که شما از آمار چیزی نفهمیده‌ای. شما سرت رو کردی زیر پتوی ریاضیات و اون رو به جای آمار به خورد دیگران می‌دهی و فکر می‌کنی که آماردان هستی در صورتی که تفاوت شمایی که اسم آماردان و با خودت یدک می‌کشی با یک ریاضی‌دان فقط در نوشتن و خواندن اسم رشته‌ها است Statistics و Mathematics فقط همین.

اهمیت (معناداری) آماری یا اهمیت (معناداری) بالینی؟ (Clinically significance or Statistical significa

در مطالعات پزشکی همواره تاکید بر روی نتایج پژوهش‌هایی است که نتایج آن به لحاظ آماری معنی‌دار باشد. بدین معنا که اگر در مقایسه دو روش بتوانید اختلاف معنی‌داری به لحاظ آماری میان این دو پیدا نمایید آن‌گاه به صراحت حکم بر برتری روشی که نتایج بهتری داشته است صادر خواهد شد و پزشکان سعی بر انجام و اجرای روش جدید خواهند نمود.

اما واقعیتی که وجود دارد این است که در مطالعات پزشکی (به مانند تمامی حیطه‌های دیگر) ما با واقعیات امر بیشتر از حقیقت آن امر مواجه هستیم. بذارید براتون یک مثال بزنم.

شما می‌دونید که مصرف آسپرین تاثیر زیادی بر پیشگیری از گرفتگی رگ‌های قلب و در نتیجه سکته قلبی دارد. الان در حال حاضر با اجرای این روش (یعنی خوردن قرض آسپرین) طول عمر بسیاری از انسان‌ها در سطح کره زمین افزایش پیدا کرده است که اگر جمع این سال‌های افزوده شده و بتونیم محاسبه کنیم قطعاً رقم بزرگی خواهد شد. بنابراین آسپرین به لحاظ بالینی (Clinically) از اهمیت برخوردار است و تاثیرگذار است. حتی در مواردی که یک روش درمانی بتواند تاثیر بسیار اندکی بر سلامت افراد بگذارد به علت این‌که این روش در مورد انسان‌های زیادی به کار گرفته می‌شود در نتیجه تاثیر آن در کل بسیار زیاد خواهد بود.

اما در مورد اهمیت یا تاثیرگذاری آماری یک روش درمانی موضوع کاملاً می‌تواند بر عکس باشد. شما با استفاده از یک روش درمانی جدید نشان دادید که می‌تونید طول عمر بیماران سرطانی را افزایش دهید. آزمون‌ها و روش‌های آماری نیز این ادعای شما را با شدت هر چه بیشتر تایید می‌کنند و به لحاظ علمی روش درمانی شما بر دیگر روش‌ها ارجحیت دارد. اما این ارجحیت در عمل ممکن است رخ ندهد، چرا که روش جدید شما بسیار پرهزینه، زمان‌بر و با استفاده از امکاناتی انجام می‌گیرد که دسترسی به‌ آن‌ها برای پزشکان یا مراکز درمانی دیگر یا امکان‌پذیر نیست و یا بسیار سخت است. بنابراین شما تنها در جمعیت محدودی می‌تونید این روش و به کار ببرید و در نتیجه با این‌که روش شما به لحاظ آماری کاملاً برتری خودش و نشان داده اما در سطح کلان نتایج آن در جامعه دیده نخواهد شد.

بنابراین در یک پژوهش یا تحقیق پزشکی بایستی هر دو جنبه اهمیت (معناداری) بالینی و هم اهمیت (معناداری) آماری در نظر گرفته شود.

تفاوت میان سانسور و برش

در مطالعات بقاء معمولاً تمرکز بر روی سانسور (Censoring) شدن داده‌ها است و توجه چندانی به مبحث برش (Truncation) نمی‌شود در صورتی که اگر در مطالعه برش وجود داشته باشد بایستی از برآوردگرهای دیگری که این موضوع و در نظر گرفتن استفاده شود. برای تفکیک این دو  موضوع تعاریف زیر برای اون‌ها بیان شده:

سانسور در مورد داده‌هایی که در نمونه در حال پیگیری شدن هستند رخ می‌دهد اما برش در مورد داده‌ها یا افرادی هستند که ما آن‌ها را ندیده‌ایم. به بیان دیگر برش در مورد طرح نمونه‌گیری است و سانسور در مورد داده‌های موجود در نمونه گرفته شده است. با استفاده از مثال تفاوت میان این دو موضوع را بهتر نشان می‌دهم

فرض کنید مطالعه‌ای قصد دارد طول عمر افرادی که با استفاده از عمل جراحی قلب باز با استفاده از روش ON pump (عمل جریان خون در هنگام عمل توسط خود قلب انجام می‌گیرد) است را مورد بررسی قرار دهد. طول دوره زمانی مطالعه 2 سال پس از عمل جراحی در نظر گرفته شده است. فرض کنید جامعه مورد بررسی بیماران جراحی شده به روش On pump در بیمارستان‌های شهر مشهد باشد. برای انجام این مطالعه نمونه‌ای به حجم 200 از بیمارانی که به این روش جراحی شده‌اند به تصادف از بیمارستان‌ها گرفته می‌شود

سپس این بیماران از زمان عمل جراحی تا دو سال پس از آن پیگیری شده‌اند (دقت کنید در این‌جا زمان ورود بیماران به مطالعه الزاماً یکی نیست و افراد در زمان‌های مختلف می‌توانند وارد مطالعه شده باشند)

در حین پیگیری این 200 بیمار 50 نفر از آنان قبل از پایان 2 سال به علت بیماری‌های مرتبط با عمل جراحی یاد شده فوت می‌کنند (گروه A). 10 نفر از این افراد از ادامه همکاری در این طرح خودداری می‌کنند (گروه B). 6 نفر از آنان به دلایل دیگری به غیر از عمل جراحی فوت می‌کنند (گروه C) (عواملی مثل تصادف، خودکشی، قتل و ...) و مابقی آنان یعنی 136 نفر از آنان پس از پایان دوره زمانی مطالعه همچنان زنده هستند (گروه D). حال بر اساس مثال فوق سانسور و برش را می‌توان تفکیک نمود.

گروه A: اطلاعات این افراد نشان دهنده طول دوره زمانی بقاء است و در این داده‌ها سانسوری وجود ندارد

گروه‌های B، C و D: افراد این گروه با توجه به این‌که زمان بقاء آنان نامشخض مانده است سانسور شده‌اند (البته نوع سانسور هر کدام یک از این گروه‌ها با هم متفاوت است)

و اما گروه E: این گروه بیمارانی هستند که به روش جراحی On pump در یکی از بیمارستان‌های مشهد جراحی شده‌اند اما در نمونه 200تایی جایی نداشته‌اند. این گروه باعث ایجاد برش در نمونه‌گیری شده و این مطالعه بایستی از روش‌های تحلیل بقایی مورد تجزیه و تحلیل قرار گیرد که موضوع برش را در نظر داشته باشد.

البته شاید این موضوع به ذهن شما خطور کند که درتمامی مطالعات آماری، ما با نمونه‌‌ای ‌از جامعه سر و کار داریم و بنابراین تمامی مطالعات بقاء دارای برش هستند.

در جواب به این سوال باید گفت که حق با شما است، در اکثریت کارهای تحقیقاتی ما با نمونه سر و کار داریم اما نه در همه آن‌ها. به عنوان مثال اگر در مثال بالا جامعه مورد بررسی به بیماران جراحی شده با استفاده از روش On pump از تاریخ شروع مطالعه به بعد در بیمارستان رضوی در نظر گرفته شود آن‌گاه می‌توانیم تمامی بیماران مورد نظر را مورد بررسی قرار داده و در این صورت دیگر خبری از برش در داده‌ها نیست  

اینجا دانشکده پزشکی است ...

اینجا دانشکده پزشکی است با فضایی کاملاً متفاوت با آن‌چه که در دانشگاه‌های وزارت علوم وجود دارد

اینجا همه چیز به کاربرد ختم می‌شود

اینجا درس‌ها با هدف استفاده از آن‌ها در میدان عمل تدریس می‌شود نه فقط برای حفظ کردن فرمول‌ها

اساتید اینجا مطالب درسی را تنها از روی کتاب‌ها یاد نگرفتند و مطالب را تنها بر اساس جزوه و کتاب منتقل نمی‌کنند

اینجا دروس محض معنایی پیدا نمی‌کنند مگر برای استفاده در عمل

اینجا دانشجویان 4 سال از 6 سال دوران دانشجویی خود را در میدان عمل می‌گذرانند

اینجا پایان‌نامه بدون نتیجه و کاربرد در عمل به درد کسی نمی‌خورد

اینجا پایان‌نامه فقط برای پر کردن کتابخانه دانشگاه نوشته نمی‌شود

اینجا هر چه بیشتر عملیاتی باشی بیشتر یاد داری

اینجا برآوردگر UMVUE در زمانی که 3 پارامتر مزاحم وجود داشته باشد به درد کسی نمی‌خورد

اینجا خبری از مسائل انتزاعی و مریخی آمار ریاضی و احتمال نیست

اینجا اگر تمرین‌های کتاب دکتر پارسیان را بلد نباشی کسی به شما نمی‌گوید که از آمار چیزی نمی‌فهمی

اینجا خبری از آنالیز ریاضی نیست

اینجا کسی به دنبال هیچ چیز نمی‌رود مگر آن‌که بخواهد از آن در عمل استفاده کند

اینجا آماری‌هایی وجود دارند که به دنبال آمار نیستند (آمار از دیدگاه آماردانان محض‌گرا تنها در استنباط و احتمال خلاصه می‌شود و کسی که در این دو زمینه کار نکند آماردان به شمار نمی‌رود!!!)

آری ما آماردان نیستیم

اما بسیار خوشنودم از این‌که اندک دانسته‌هایم در آمار را برای بهبود شرایط زندگی انسان‌ها به کار می‌گیرم

نه برای یافتن بهترین برآوردگر با کمترین واریانس با 2 پارامتر مزاح و نمونه‌ای از توزیع دریخله با ....

تقریباً همه چیز در مورد ارشد آمار زیستی

تو این مدت اخیر یعین تقریباً از دو هفته پیش تا حالا تعداد افرادی که در مورد امتحان ارشد آمار زیستی سوالاتی که از من و دیگر دوستانم کردند به صور فزاینده ای رو به افزایش بوده به همین علت تو این پست سعی می کنم تجربیات شخص ام و در این مورد براتون بگم. فقط دقت کنید که این تجربیات منه و ممکنه برای یک نفر مفید و برای کسی دیگه نه چندان مفید باشه.

قبل از هر چیز باید بگم من یک سمیناری در ارتباط با آمار زیستی و به خصوص امتحان ارشد اون تو دانشکده سابقم  (آزاد مشهد) داشتم که فایل پرزنت شده اون و اینجا گذاشتم که حاوی اطلاعات خوب و کاملی در مورد ارشد آمار زیستی است.

اما چند نکته که تو اون فایل نیست و اینجا براتون می گم

۱ - اولین و مهمترین نکته ای که وجود داره این که فضای ارشد آمار زیستی با اون چه که در دوره لیسانس و ارشد آمار محض وجود داره کاملاً متفاوت. یعنی این که تو این دوره شما باید با یک دید کاربردی به مسائل نگاه کنید. شاید در اولین نگاه بگید که این موضوع خیلی خوبه، اما باید این موضوع و در نظر داشته باشید که ما در دوره لیسانس آمار و به صورت محض می خونیم ک حالا این مقطع باید اون دیدگاه ۴ ساله محض و عوض کنیم که این کار تا حد بسیار زیادی مشکل. این و از این جهت میگم چون یکی از دوستان هم دوره ای من که دانشجوی شیراز هم بوده و انصافاً محض بسیار قوی داره الان با این رشته دچار مشکل شده.

البته شما اگر واقعاً به دنبال کاربرد آمار باشید مطمئن باشید کاربردی ترین گرایش آمار در ایران همین آمار زیستی است. من که خودم تو همون دوره لیسانس از درس های محض مثل آمار ریاضی و احتمال فراری بودم و علاقه خاصی به کاربرد داشتم و هدف اصلی من هم همین آمار زیستی بود و بدون هبچ گونه اغراقی بگم که الان دارم به معنای واقعی حال می کنم

۲- بر خلاف اون چیزی که در دیدگاه عامه وجود داره ارشد آمار زیستی به این راحتی ها هم نیست. البته این موضوع و در مقایسه با دیگر گرایش های آمار می گم (چون من دوستانی هم در گرایش آمار محض و هم در گرایش آمار اقتصادی و اجتماعی دارم که تا حد زیادی با اون گرایش ها هم آشنام)

ببنید تو ارشد محض (که اکثراً این و می رن) درس ها همه مشخص و در یک راستا است. چهار چوب کلی با استنباط و احتمال بسته می شه که فضای هر دوی این ها شبیه هم هست (دقت کنید شبیه نه یکسان) اما تو آمار زیستی این طوری نیست. شما باید تبدیل بشید به یک متخصص آمار اما با دیدگاه پزشکی، یعنی باید به مفاهیم پزشکی هم تسلط داشته باشید (که این خودش کلی کار داره و حسابی وقت و انرژی می خواد) تازه بعد از اون محتوای درسی دروس آماری هم متفاوت می شه یعنی مثل محض نیست که شما همون احتمال و آمار ریاضی دوره لیسانس و بیاد تو ارشد بازش کنید. تو این دوره شما باید با مفاهیم جدید آماری آشنا بشید که قبلاً ندید و این ها همگی نیاز به زمان و انرژی داره که اگر واقعاً علاقه مند به آمار کاربردی نباشید مشکل ساز خواهد شد.

خوب فعلاً همین ها کافیه. ببخشید که این قدر منفی بافی کردم. خواستم اون نکات شاید نه جندان دلچسبش و بگم تا با دیدگاه واقع بینانه وارد بشید. البته اگه از من بپرسید هیج رشته ای مثل آمار زیستی این قدر جذاب و کاربردی نیست من که دارم حالش و می برم 

شاید باورتون نشه

شاید باورتون نشه ولی این مدتی که نبودم به این دلیل بود که رمز عبور یا همون پسم و فراموش کرده بودم و همین چند دقیقه پیش یادم اومد که چی بوده.

تو این مدتی که نبودم کلی حرف داشتم که می خواستم بگم اما نمی شد. اما همش و یادمه و به همین زودی ها می ریزمشون رو دایره