پژوهش در نشخوارکنندگان (Nov 2017)
امکان سنجی آنتروپی نسبی در خوشه بندی تعدادی از ژنهای موثر بر تولید شیر در گاو شیری
Abstract
چکیده سابقه و هدف: جدا از اینکه شیر نقش مهمی در تغذیه انسان ایفا مینماید، افزایش تولید شیر و یا تغییر در میزان ترکیبات آن بیشترین توجه اصلاحگران گاو شیری را به خود اختصاص داده است به همین علت پژوهش و بررسی ژنهایی که روی تولید و ترکیب شیر نقش موثری دارند، بسیار با اهمیت است. نظریه اطلاعات، شاخهای از ریاضیات است که با مهندسی ارتباطات، زیست شناسی و پزشکی همپوشانی دارد. آنتروپی اندازهای از عدم قطعیت در مجموعه اطلاعات است. شانون در مقاله مشهور خود در سال 1948 این مفهوم را معرفی کرده و نتایج آن را در تعدادی از مسائل پایهای نظریه کدگذاری و انتقال دادهها مورد استفاده قرار داد که پایه نظریه اطلاعات جدید را تشکیل میدهد. از تئوری اطلاعات در تجزیه و تحلیل های ژنتیکی و بیوانفورماتیکی استفاده گردیده و میتوان از آن جهت بسیاری از آنالیزهای مربوط به ساختارها و توالیهای زیستی استفاده نمود. مواد و روشها: توالی 30DNA ژن مربوط به تولید پروتئین شیر به صورت جداگانه از پایگاه داده ژنوم NCBI استخراج و در فرمت FASTA ذخیره شد. در این پژوهش برای هر مجموعه ژن و اگزونهای آن فراسنجه آنتروپی در مراتب یک الی چهار محاسبه شد. در این راستا از زنجیره مارکف تا رتبه 3 استفاده گردید. بر اساس آنتروپی نسبی حاصله برای ژنها و اگزونها، واگرایی کولبک – لیبلر برای ژنها و اگزونها تعریف و محاسبه گردید. سپس ماتریس واگرایی کولبک – لیبلر ژنها و اگزونها به عنوان ورودی 7 روش معمول خوشه بندی Single ، Complete،Average ، Weighted،Centroid ، MedianوK-Means در نظر گرفته شد. برای تجمیع نتایج حاصل از خوشه بندیهای مختلف، از الگوریتم AdaBoost استفاده گردید. در پایــان جهت تایید نتایج حاصل از AdaBoost و پیش بینی عملکرد ژنها و ارتباط بین آنها، با مراجعه به GeneMANIA prediction server نتایج بر اساس حاشیه نویسی ژنومی آنها مورد بررسی و مقایسه قرار گرفت. همه محاسبات با استفاده از نرم افزار مهندسی متلب نسخه 2015 انجام گردید. یافته ها: با بررسی نتایج در GeneMANIA prediction server ، ارتباط متقابل و مسیرهای متابولیکی مشترک ژنها براساس حاشیه نویسی ژنومی آنها، روش خوشه بندی ارایه شده را روشی صحیح، منطقی و در عین حال سریع نشان داد. این روش علاوه بر اینکه زمانبر بودن حاصل از همتراز نمودن ژنها را نداشته، محتوا و اندازه واقعی ژنها را مورد بررسی قرار داده و نیاز به حافظه بالا برای پردازش فایلهای همردیف توالیهای با طول بزرگ را ندارد. نتیجه گیری: نتـایج نشـان داد که روش پیشنـهادی جهت خوشه بنـدی مجموعهای از ژن ها به لحاظ زیستی بسیار جـذاب به نظر می رسد. اعتقاد بر این است که روش ارائه شده میتواند با سایر روشها از جهت خوشه بندی مجموعهای از ژنها رقابت نماید. روش یاد شده میتواند به عنوان یک روش پیش بینی عملکرد زیستی ژنهایی با دادههای حاشیه نویسی ژنومی ضعیف نیز در نظر گرفته شود.
Keywords