پژوهش در نشخوارکنندگان (Nov 2017)

امکان سنجی آنتروپی نسبی در خوشه بندی تعدادی از ژن‌های موثر بر تولید شیر در گاو شیری

  • هوشنگ دهقان زاده,
  • سید ضیاء الدین میرحسینی,
  • مصطفی قادری زفره ای,
  • حسن توکلی,
  • سعید اسماعیل خانیان

DOI
https://doi.org/10.22069/ejrr.2017.13707.1570
Journal volume & issue
Vol. 5, no. 3
pp. 69 – 86

Abstract

Read online

چکیده سابقه و هدف: جدا از اینکه شیر نقش مهمی در تغذیه انسان ایفا می‌نماید، افزایش تولید شیر و یا تغییر در میزان ترکیبات آن بیشترین توجه اصلاحگران گاو شیری را به خود اختصاص داده است به همین علت پژوهش و بررسی ژنهایی که روی تولید و ترکیب شیر نقش موثری دارند، بسیار با اهمیت است. نظریه‌ اطلاعات، شاخه‌ای از ریاضیات است که با مهندسی ارتباطات، زیست شناسی و پزشکی همپوشانی دارد. آنتروپی اندازه‌ای از عدم قطعیت در مجموعه اطلاعات است. شانون در مقاله مشهور خود در سال 1948 این مفهوم را معرفی کرده و نتایج آن را در تعدادی از مسائل پایه‌ای نظریه‌ کدگذاری و انتقال داده‌ها مورد استفاده قرار داد که پایه‌ نظریه‌ اطلاعات جدید را تشکیل می‌دهد. از تئوری اطلاعات در تجزیه و تحلیل های ژنتیکی و بیوانفورماتیکی استفاده گردیده و میتوان از آن جهت بسیاری از آنالیز‌های مربوط به ساختارها و توالی‌های زیستی استفاده نمود. مواد و روشها‌: توالی 30DNA ژن مربوط به تولید پروتئین شیر به صورت جداگانه از پایگاه داده ژنوم NCBI استخراج و در فرمت FASTA ذخیره شد. در این پژوهش برای هر مجموعه ژن و اگزون‌های آن فراسنجه آنتروپی در مراتب یک الی چهار محاسبه شد. در این راستا از زنجیره مارکف تا رتبه 3 استفاده گردید. بر اساس آنتروپی نسبی حاصله برای ژن‌ها و اگزون‌ها، واگرایی کولبک – لیبلر برای ژن‌ها و اگزون‌ها تعریف و محاسبه گردید. سپس ماتریس واگرایی کولبک – لیبلر ژنها و اگزونها به عنوان ورودی 7 روش معمول خوشه بندی Single ، Complete،Average ، Weighted،Centroid ، MedianوK-Means در نظر گرفته شد. برای تجمیع نتایج حاصل از خوشه بندی‌های مختلف، از الگوریتم AdaBoost استفاده گردید. در پایــان جهت تایید نتایج حاصل از AdaBoost و پیش بینی عملکرد ژن‌ها و ارتباط بین آنها، با مراجعه به GeneMANIA prediction server نتایج بر اساس حاشیه نویسی ژنومی آن‌ها مورد بررسی و مقایسه قرار گرفت. همه محاسبات با استفاده از نرم افزار مهندسی متلب نسخه 2015 انجام گردید. یافته ها‌: با بررسی نتایج در GeneMANIA prediction server ، ارتباط متقابل و مسیرهای متابولیکی مشترک ژن‌ها براساس حاشیه نویسی ژنومی آن‌ها، روش خوشه بندی ارایه شده را روشی صحیح، منطقی و در عین حال سریع نشان داد. این روش علاوه بر اینکه زمانبر بودن حاصل از همتراز نمودن ژن‌ها را نداشته، محتوا و اندازه واقعی ژن‌ها را مورد بررسی قرار داده و نیاز به حافظه بالا برای پردازش فایل‌های همردیف توالی‌های با طول بزرگ را ندارد. نتیجه گیری: نتـایج نشـان داد که روش پیشنـهادی جهت خوشه بنـدی مجموعه‌ای از ژن ها به لحاظ زیستی بسیار جـذاب به نظر می رسد. اعتقاد بر این است که روش ارائه شده می‌تواند با سایر روش‌ها از جهت خوشه بندی مجموعه‌ای از ژنها رقابت نماید. روش یاد شده می‌تواند به عنوان یک روش پیش بینی عملکرد زیستی ژن‌هایی با داده‌های حاشیه نویسی ژنومی ضعیف نیز در نظر گرفته شود.

Keywords