التسلسل الخالي من المحاذاة

في المعلوماتية الحيوية، طرق تحليل التسلسلات الخالية من المحاذاة إلى تسلسلات جزيئية وبيانات مهيكلة تقدم بدائل عن طرق التسلسلات التي تعتمد على المحاذاة الانبثاق والحاجة لتحليل أنواع مختلفة من البيانات تولدت عن طريق البحوث الحيوية، قدمت نهوضا في مجال المعلومات الحيوية.[1] التسلسلات الجزيئية والبيانات المهيكلة حمض نووي ريبوزي منقوص الأكسجين، حمض نووي ريبوزي، وبروتين، جوانب تعبير جيني أو بيانات المصفوفة الدقيقة للاحماض النووية، مسار أيضي (الايض الاستقلابي) هي بعض الانواع الاساسية للبيانات التي تم تحليلها في المعلومات الحيوية. فيما بينهم، بيانات التسلسلات تزيد بمعدل متسارع وذلك يعود إلى ظهور الجيل التالي من تقنيات التسلسل. منذ نشأة المعلومات الحيوية، ظل تحليل التسلسلات مجال البحث الرئيسي مع تطبيقات واسعة المدى في تحليل قواعد البيانات، التعليقات التوضيحية للجينوم، علم الجينوم المقارن، نسالة جزيئية (علم الوراثة الجزيئي), تنبؤ بالمورثات الجيني. الطرق الرائدة لتحليل التسلسلات تعتمد على تسلسلات المحاذاة سواء كانت عالمية أو محلية، زوجية أو متعددة.[2][3] الطرق التي تعتمد على المحاذاة تقدم نتائج ممتازه بشكل عام عندما تكون التسلسلات قيد الدراسة وثيقة الصلة ويمكن محاذاتها بشكل موثوق، ولكن عندما تكون التسلسلات متباينة، لن نتمكن من الحصول على محاذاة موثوقة وبالتالي تطبيقات تسلسلات المحاذاة تكون محدودة. سلبية أخرى للتسلسلات التي تعتمد على المحاذاة هي تعقيقداتها الحسابية واستهلاكها للوقت وبالتالي يقل استخدامها عند التعامل مع بيانات تسلسل واسعة النطاق. نتج عن ظهور الجيل التالي من تقنيات التسلسل توليد بيانات تسلسلات ضخمة.[4] حجم هذه البيانات يفرض تحديات على خوارزميات التسلسلات التي تعتمد على المحاذاة من خلال تجميعها، توضيحها (بوضع ملاحظات), مقارنتها مع دراسات مشابهه.

طرق خالية من المحاذاة

يمكن تصنيف الطرق الخالية من المحاذاة على نطاق واسع إلى خمس فئات: أ) طرق تعتمد على تردد، ب) طرق تعتمد على طول السلاسل الفرعية الشائعة، ج) طرق تعتمد على عدد مطابقات الكلمات (المباعدة)، د) طرق تعتمد على المحاذاة الدقيقة، هـ) طرق تستند إلى نظرية المعلومات و) طرق تعتمد على التمثيل البياني. تم استخدام مناهج خالية من المحاذاة في عمليات البحث عن التشابه المتسلسل [5] ، تجميع وتصنيف التسلسلات، ومؤخرًا في علم الوراثة النمائي.[6]

المصادر

  1. ^ Rothberg J، Merriman B، Higgs G (سبتمبر 2012). "Bioinformatics. Introduction". The Yale Journal of Biology and Medicine. ج. 85 ع. 3: 305–8. PMC:3447194. PMID:23189382.
  2. ^ Batzoglou S (مارس 2005). "The many faces of sequence alignment". Briefings in Bioinformatics. ج. 6 ع. 1: 6–22. DOI:10.1093/bib/6.1.6. PMID:15826353.
  3. ^ Mullan L (مارس 2006). "Pairwise sequence alignment--it's all about us!". Briefings in Bioinformatics. ج. 7 ع. 1: 113–5. DOI:10.1093/bib/bbk008. PMID:16761368.
  4. ^ Kemena C، Notredame C (أكتوبر 2009). "Upcoming challenges for multiple sequence alignment methods in the high-throughput era". Bioinformatics. ج. 25 ع. 19: 2455–65. DOI:10.1093/bioinformatics/btp452. PMC:2752613. PMID:19648142.
  5. ^ Hide W، Burke J، Davison DB (1994). "Biological evaluation of d2, an algorithm for high-performance sequence comparison". Journal of Computational Biology. ج. 1 ع. 3: 199–215. DOI:10.1089/cmb.1994.1.199. PMID:8790465.
  6. ^ Chan CX، Ragan MA (يناير 2013). "Next-generation phylogenomics". Biology Direct. ج. 8: 3. DOI:10.1186/1745-6150-8-3. PMC:3564786. PMID:23339707.