يرجى مراجعة هذه المقالة وإزالة وسم المقالات غير المراجعة، ووسمها بوسوم الصيانة المناسبة.

تتابع الحمض النووي الريبي RNA

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث
ملخص RNA-Seq. داخل الكائن الحي ، يتم نسخ الجينات وتقسيمها (في كائن حقيقي النواة) لإنتاج نسخ مرنا ناضجة (أحمر). يتم استخراج مرنا من الكائن الحي، مجزأة ونسخها إلى مستقر [كدنا] (الأزرق). والتسلسل وس-كدنا] باستخدام الإنتاجية العالية، وأساليب التسلسل قصيرة المقروءة. يمكن بعد ذلك محاذاة هذه التسلسلات إلى تسلسل الجينوم المرجعي لإعادة بناء مناطق الجينوم التي تم نسخها. يمكن استخدام هذه البيانات لتوضيح مكان وجود الجينات المعبر عنها ومستويات التعبير النسبي وأي متغيرات لصق بديلة.[1]

يستخدم RNA-Seq تسلسل الجيل التالي (NGS) للكشف عن وجود وكمية من الحمض النووي الريبي في عينة بيولوجية في لحظة معينة، وتحليل المتغير الخلوي المستمر.[2] [3]

على وجه التحديد، يسهل RNA-Seq القدرة على النظر إلى الجينات البديلة المقسمة، والتعديلات بعد النسخ، والانصهار الجيني، والطفرات / SNPs والتغيرات في التعبير الجيني مع مرور الوقت، أو الاختلافات في التعبير الجيني في مجموعات أو علاجات مختلفة.[4] بالإضافة إلى نسخ mRNA، يمكن أن ينظر RNA-Seq إلى مجموعات مختلفة من الحمض النووي الريبي (RNA) لتشمل إجمالي الحمض النووي الريبي (RNA)، والحمض النووي الريبي (RNA) الصغير، مثل miRNA، الحمض الريبي النووي النقال (tRNA)، وتحديد ملامح الريبوسوم.[5] يمكن أيضًا استخدام RNA-Seq لتحديد حدود exon / intron والتحقق من أو تعديل حدود الجين الموضحة مسبقًا 5 و3. تشمل التطورات الحديثة في RNA-Seq تسلسل خلية وحيدة وتسلسل الأنسجة الثابتة في الموقع.[6]

قبل RNA-Seq، أجريت دراسات التعبير الجيني مع المصفوفات الدقيقة القائمة على التهجين. تشمل مشاكل المصفوفات الدقيقة القطع الجينية المتقاطعة، التهميش السيئ للجينات منخفضة الوزن وعالية التعبير، والحاجة إلى معرفة التسلسل المسبق.[7] بسبب هذه المشكلات الفنية، انتقلت النصوص إلى الأساليب القائمة على التسلسل. لقد تطورت هذه من تسلسل Sanger في مكتبات Expressed Sequence Tag، إلى الأساليب القائمة على العلامات الكيميائية (على سبيل المثال، التحليل التسلسلي للتعبير الجيني)، وأخيراً إلى التكنولوجيا الحالية، تسلسل الجيل القادم من cDNA (خاصة RNA-Seq).

الأساليب

إعداد متسلسل

نظرة عامة على سير العمل التجريبي RNA-Seq النموذجي.[8]

الخطوات العامة لإعداد متسلسل DNA (cDNA) التكميلية للتسلسل موضحة أسفل، ولكن غالبًا ما تختلف بين المنصات. [8] [3] [9]

  1. عزل الحمض النووي الريبي (RNA): يتم عزل الحمض النووي الريبي (RNA) من الأنسجة ويخلط مع (DNase) DNase يقلل من كمية الحمض النووي الجيني. يتم ضبط الكمية المفككة من الحمض النووي الريبي مع هلام والخلاصة التحليل الكهربي لمحتوى الشعيرات الدموية ويستخدم لتعيين عدد سلامة الحمض النووي الريبي للعينة. تؤخذ جودة الحمض النووي الريبي (RNA) والمبلغ الإجمالي لبدء الحمض النووي الريبي (RNA) في الاعتبار أثناء خطوات إعداد وتسلسل وتحليل المكتبة اللاحقة.
  2. اختيار / نضوب الحمض النووي الريبي: لتحليل إشارات الاهتمام، يمكن إما الاحتفاظ بالحمض النووي الريبي المعزول كما هو، مع ترشيح الحمض النووي الريبي مع ذيول متعددة الأقطاب (3) متعددة (poly (A) لتشمل فقط rRNA، المستخلص من الحمض النووي (rRNA)، و / أو تمت تصفيته من أجل الحمض النووي الريبي (RNA) الذي يربط تسلسلات محددة (جدول اختيار ونضج الحمض النووي الريبي، أسفل). الحمض النووي الريبي مع ذيول 3 '(بولي) الناضجة، والمعالجة، والتابعة لتسلسل الترميز. يتم اختيار (Poly A) عن طريق مزج الحمض النووي الريبي (RNA) مع قلة قليلة من القسيمات (T) المرتبطة تساهميًا بالركيزة، الخرز المغناطيسي عادة.[10] [11] يتجاهل اختيار (Poly A) الحمض النووي الريبي غير المشفر ويقدم تحيزًا 3 '، [12] والذي يتم تجنبه باستراتيجية نضوب الريبوسوم. تتم إزالة rRNA لأنه يمثل أكثر من 90 ٪ من الحمض النووي الريبي في الخلية، والتي إذا تم الاحتفاظ بها سوف تتخلص من البيانات الأخرى.
  3. تخليق cDNA: يتم نسخ RNA إلى cDNA لأن الحمض النووي أكثر استقرارًا ويسمح بالتضخيم (عن طريق polymerases الحمض النووي) وتقنية تسلسل الحمض النووي أكثر نضجًا. يؤدي التضخيم اللاحق للنسخ العكسي إلى فقد السبل، والتي يمكن تجنبها بالوسم الكيميائي أو تسلسل جزيء واحد. يتم تنفيذ تجزئة واختيار الحجم لتنقية التسلسلات التي هي الطول المناسب لآلة التسلسل. الحمض النووي الريبيrRNA، cDNA, أو كليهما مجزأ مع الإنزيمات، صوتنه، أو البخاخات. يعمل تجزئة الحمض النووي الريبي على تقليل انحياز 5 'من النسخ العكسي العشوائي وتأثير مواقع الربط التمهيدي، مع الجانب الذي ينتهي به الطرفان 5 و3 إلى الحمض النووي أقل كفاءة. يتبع التجزؤ اختيار الحجم، حيث تتم إزالة تسلسلات صغيرة أو تحديد نطاق ضيق من أطوال التسلسل. بسبب ضياع rRNA الصغيرة مثل miRNAs، يتم تحليلها بشكل مستقل. يمكن فهرسة cDNA لكل تجربة مع الباركود hexamer أو octamer، بحيث يمكن تجميع هذه التجارب في مسار واحد لتسلسل متعدد الإرسال.
طرق اختيار وانضاب الحمض النووي الريبي: [8]
إستراتيجية نوع الحمض النووي rRNA محتوى الحمض النووي rRNA محتوى الحمض النووي rRNA غير المعالج محتوى الحمض النووي الجيني طريقة عزل المحتوى
مجموع الحمض النووي rRNA الكل عالي عالي عالي لا شيء
اختيار PolyA مرموز منخفض منخفض منخفض تهجين مع oligomers بولي (dT)
نضوب rRNA مرموز، غير مرموز منخفض عالي عالي زالة ال oligomers المكملة ل rRNA 
الحصول على rRNA مستهدف منخفض متوسط منخفض التهجين مع اجزاء مكملة للتابعات المطلوبة 

RNA صغير / غير مرموز لتسلسل RNA

عند إجراء تسلسل RNA غير miRNA، يتم تعديل إعداد التسلسل. يتم تحديد الحمض النووي الريبي على أساس نطاق الحجم المطلوب. لأهداف الحمض النووي الريبي الصغيرة، مثل miRNA، يتم عزل الحمض النووي الريبي من خلال اختيار الحجم. يمكن إجراء ذلك باستخدام هلام استبعاد الحجم، من خلال حبات مغناطيسية لاختيار الحجم، أو باستخدام مجموعة تم تطويرها تجاريًا. بمجرد عزلها، تتم إضافة الروابط إلى النهاية 3 'و5' ثم تنقيتها. والخطوة الأخيرة هي الجيل cDNA من خلال النسخ العكسي.

تسلسل الحمض النووي الريبي rRNA المباشر

نظرًا لأن تحويل الحمض النووي الريبي إلى الحمض النووي الريبي النووي (cDNA)، فقد ثبت أن عمليات الربط، والتضخيم، والتلاعب بالعينات الأخرى تقدم تحيزات وأدوات أثرية قد تتداخل مع كل من التوصيف الصحيح والتابعات الصحيحة للنصوص الجينية، [13] تم استكشاف تسلسل الحمض النووي الريبي المباشر للجزيء المفرد [13] ، بما في ذلك Helicos (المفلسة)، أوكسفورد نانوبور تكنولوجيز، [14] وغيرها. هذه التكنولوجيا تسلسل جزيئات الحمض النووي الريبي مباشرة بطريقة موازية على نطاق واسع.

تسلسل RNA أحادي الخلية (scRNA-Seq)

الطرق القياسية مثل المصفوفات الدقيقة وتحليل المعيار RNA-Seq يحلل تعبير ال rRNA من مجموعات كبيرة من الخلايا. في مجموعات الخلايا المختلطة، قد تحجب هذه القياسات الفروق الحرجة بين الخلايا الفردية داخل هذه المجموعات.[15] [16]

يوفر تسلسل الحمض النووي الريبي أحادي الخلية (scRNA-Seq) ملفات تعريف للخلايا الفردية. على الرغم من أنه لا يمكن الحصول على معلومات كاملة عن كل RNA الذي يعبر عن كل خلية، نظرًا للكمية الضئيلة من المواد المتاحة، يمكن التعرف على أنماط التعبير الجيني من خلال تحليلات تجميع الجينات. هذا يمكن أن يكشف عن وجود أنواع خلايا نادرة داخل مجتمع الخلية والتي ربما لم يسبق رؤيتها من قبل. على سبيل المثال، تم تحديد خلايا متخصصة نادرة في الرئة تدعى الخلايا الأيونية الرئوية التي تعبر عن منظم توصيل غشاء التليف الكيسي في 2018 من قبل مجموعتين تؤديان ال rRna ساق على ظهارة مجرى الرئة.[17] [18]

الإجراءات التجريبية

خلية عمل تسلسل RNA أحادية الخلية

تتضمن بروتوكولات scRNA-Seq الحالية الخطوات التالية: عزل خلية واحدة وRNA، النسخ العكسي (RT)، والتضخيم، وتوليد التسلسل، والتسلسل. طرق مبكرة فصل الخلايا الفردية إلى آبار منفصلة. طرق أكثر حداثة تغلف الخلايا الفردية في قطرات في جهاز ميكروفلويديك، حيث يحدث رد فعل النسخ العكسي، وتحويل الحمض النووي الريبي إلى cDNAكل قطرة تحمل «الباركود» DNA الذي يسمي بشكل فريدcDNA المستمدة من خلية واحدة. بمجرد اكتمال النسخ العكسي، يمكن خلط cDNAمن العديد من الخلايا معًا للتسلسل؛ يتم التعرف على النصوص من خلية معينة بواسطة الرمز الشريطي الفريد.[19] [20]

تشمل تحديات scRNA-Seq الحفاظ على الوفرة النسبية الأولية للـ mRNA في الخلية وتحديد النصوص النادرة.[21] تعتبر خطوة النسخ العكسي أمرًا بالغ الأهمية نظرًا لأن كفاءة رد فعل RT تحدد مقدار تحليل الحمض النووي الريبي للخلية الذي سيتم تحليله في نهاية الأمر بواسطة جهاز التسلسل. قد تؤثر قابلية النسخ العكسي واستراتيجيات التحضير المستخدمة على إنتاج cDNA كامل الطول وتوليد مكتبات منحازة نحو نهاية 3 أو 5 'من الجينات.

في خطوة التضخيم، يتم الآن استخدام PCR أو في النسخ المختبرية (IVT) لتضخيم cDNA واحدة من مزايا الأساليب القائمة على PCR هي القدرة على توليد cDNA كامل الطول. ومع ذلك، قد يتم تضخيم كفاءة PCR مختلفة على تسلسلات معينة على سبيل المثال، محتوى GC وهيكل snapback بشكل كبير، مما ينتج مكتبات ذات تغطية غير متساوية. من ناحية أخرى، في حين أن التسلسلات التي تم إنشاؤها بواسطة IVT يمكنها تجنب تحيز التسلسل الناتج عن PCR، فقد يتم نسخ تسلسلات محددة بطريقة غير فعالة، مما يسبب تسلسل المتسلسل أو توليد تسلسلات غير مكتملة.[22] [15] تم نشر العديد من بروتوكولات scRNA-Seq: Tang et al. STRT.[23] STRT ، [24] SMART-seq ، [25] CEL-seq ، [26] RAGE-seq ، [27] ، Quartz-seq.[28] و C1-CAGE.[29] من حيث استراتيجيات النسخ العكسي، وتوليف cDNA والتضخيم، وإمكانية استيعاب الباركود الخاصة بالتسلسل مثل UMIs أو القدرة على معالجة العينات المجمعة.[30]

في عام 2017، تم تقديم طريقتين لقياس في وقت واحد مرنا وحيد الخلية وتعبير البروتين من خلال الأجسام المضادة المسمى أليغنوكليوتيد المعروفة باسم REAP-seq ، [31] و CITE-seq.[32]

تطبيقات

أصبح scRNA-Seq يستخدم على نطاق واسع عبر التخصصات البيولوجية بما في ذلك التنمية، وعلم الأعصاب، [33] علم الأورام، [34] [35] [36] مرض المناعة الذاتية، [37] والأمراض المعدية.[38]

قدمت scRNA-Seq نظرة ثاقبة كبيرة في تطور الأجنة والكائنات الحية، بما في ذلك دودة Caenorhabditis elegans ، [39] والمستوصف الشمسي التجديدي المتوسطي . [40] [41] كانت أول الحيوانات الفقارية التي تم تعيينها بهذه الطريقة هي الزرد [42] [43] و Xenopus laevis.[44] في كل حالة، تمت دراسة مراحل متعددة من الجنين، مما يسمح برسم عملية التنمية بأكملها على أساس كل خلية على حدة. [8] لقد أدرك العلم أن هذه التطورات هي " اختراق العام 2018 ".[45]

الاعتبارات التجريبية

يتم مراعاة مجموعة متنوعة من المعلمات عند تصميم وإجراء تجارب RNA-Seq:

  • نوعية الأنسجة: يختلف التعبير الجيني داخل الأنسجة وفيما بينها، ويقيس RNA-Seq هذا المزيج من أنواع الخلايا. هذا قد يجعل من الصعب عزل الآلية البيولوجية للاهتمام. يمكن استخدام تسلسل خلية واحدة لدراسة كل خلية على حدة، وتخفيف هذه المشكلة.
  • الاعتماد على الوقت: يتغير تعبير الجينات بمرور الوقت، ولا يأخذ RNA-Seq سوى لقطة. يمكن إجراء تجارب الدورة الزمنية لمراقبة التغييرات في النص الجيني.
  • التغطية (المعروف أيضًا باسم العمق): يحتوي الحمض النووي الريبي على نفس الطفرات التي لوحظت في الحمض النووي، ويتطلب الكشف تغطية أعمق. مع تغطية عالية بما فيه الكفاية، يمكن استخدام RNA-Seq لتقدير التعبير عن كل أليل. قد يوفر هذا نظرة ثاقبة الظواهر مثل التأثيرات أو التأثيرات التنظيمية. يمكن استقراء عمق التسلسل المطلوب لتطبيقات محددة من تجربة تجريبية.[46]
  • قطع لتوليد البيانات (تُعرف أيضًا باسم التباين التقني): يمكن أن تؤدي الكواشف (على سبيل المثال، مجموعة إعداد التسلسل) والموظفين المعنيين ونوع جهاز التسلسل على سبيل المثال، Illumina وPacific Biosciences إلى آثار فنية قد يساء تفسيرها على أنها نتائج ذات معنى. كما هو الحال مع أي تجربة علمية، من الحكمة إجراء RNA-Seq في بيئة جيدة التحكم. إذا لم يكن ذلك ممكنًا أو كانت الدراسة عبارة عن تحليل تلوي، فإن الحل الآخر هو اكتشاف القطع الفنية عن طريق استنتاج المتغيرات الكامنة (عادة تحليل المكون الرئيسي أو تحليل العوامل) والتصحيح لاحقًا لهذه المتغيرات.[47]
  • إدارة البيانات: عادة ما تكون تجربة RNA-Seq في البشر في حدود 1 غيغابايت.[48] هذا الحجم الكبير من البيانات يمكن أن يطرح مشاكل التخزين. أحد الحلول هو ضغط البيانات باستخدام مخططات حسابية متعددة الأغراض (على سبيل المثال، gzip أو مخططات خاصة بالجينوم. هذا الأخير يمكن أن يكون على أساس تسلسل مرجعي أو دي نوفو. الحل الآخر هو إجراء تجارب ميكروأري، والتي قد تكون كافية لإجراء الدراسات التي تعتمد على الفرضيات أو تكرارها على عكس البحوث الاستكشافية.

التحليل

رسم تخطيطي يوضح تحليلات RNA-Seq الموصوفة في هذا القسم

التجمع النسخي

يتم استخدام طريقتين لتعيين تسلسلات القراءة الأولية للميزات الجينومية (أي تجميع النص الجيني):

  • دي نوفو: هذا النهج لا يحتاج إلى جينوم مرجعي لإعادة بناء النص، ويستخدم عادة إذا كان الجينوم غير معروف، غير مكتمل، أو تم تغييره بشكل كبير مقارنة بالمرجع.[49] تتضمن التحديات عند استخدام عمليات القراءة القصيرة لتجميع de novo 1)) تحديد القراءات التي يجب ضمها معًا في تسلسلات متجاورة contigs)، 2) متانة أخطاء التسلسل وغيرها من الأعمال الفنية، و3 الكفاءة الحسابية. تم نقل الخوارزمية الأساسية المستخدمة لتجميع de novo من الرسوم البيانية المتداخلة، والتي تحدد جميع التداخلات بين الزوجين إلى القراءات، إلى الرسوم البيانية لـ Bru Brunn، والتي تقسم القراءة إلى تسلسلات طولها k وتنهار كل k-mers في جدول تجزئة.[50] تم استخدام الرسوم البيانية المتداخلة مع تسلسل Sanger، لكن لا يتم القياس جيدًا إلى ملايين القراءات التي تم إنشاؤها باستخدام RNA-Seq. أمثلة على المجمعات التي تستخدم الرسوم البيانية دي Bruijn هي Velvet ، [51] Trinity ، Oases ، [52] و Bridger.[53] يمكن للنهاية المزدوجة وتسلسل القراءة الطويلة من نفس العينة أن يخففا من العجز في تسلسل القراءة القصيرة من خلال العمل كقالب أو هيكل عظمي. تشتمل مقاييس تقييم جودة مجموعة de novo على متوسط طول contig وعدد contigs و N50.[54]
خرائط RNA-Seq للقراءات القصيرة في تقاطعات exon-exon. يتم ترتيب mRNT النهائي ، والذي يفتقد أجزاء intronic من قبل pre-mRNA.
  • دليل الجينوم: تعتمد هذه الطريقة على نفس الأساليب المستخدمة لمحاذاة الحمض النووي، مع التعقيد الإضافي المتمثل في محاذاة القراءات التي تغطي أجزاء غير مستمرة من الجينوم المرجعي.[55] هذه القراءات غير المستمرة هي نتيجة لتسلسل النصوص المقسمة (انظر الشكل). عادة، تحتوي خوارزميات المحاذاة على خطوتين: 1) محاذاة أجزاء قصيرة من القراءة (أي، بداية الجينوم)، و 2) استخدام البرمجة الديناميكية لإيجاد محاذاة مثالية، وأحيانًا بالاقتران مع تعليقات توضيحية معروفة. تشمل أدوات البرمجيات التي تستخدم المحاذاة الموجهة للجينوم Bowtie ، [56] TopHat (الذي يبني على نتائج BowTie لمحاذاة الوصلات الفاصلة)، [57] [58] Subread ، [59] STAR ، HISAT2 ، [60] Sailfish ، [61] كاليستو، [62] و GMAP.[63] يمكن قياس جودة التجميع الموجه للجينوم بمقاييس التجميع 1) de novo (على سبيل المثال، N50) و 2) مقارنات بالتسلسلات المعروفة، تقاطع الوصلات، الجينوم، والبروتين باستخدام الدقة ، الاستعادة، أو توليفها (على سبيل المثال، النتيجة F1). [54] بالإضافة إلى ذلك، يمكن إجراء تقييم السيليكو باستخدام قراءات محاكية.[64] [65]

ملاحظة على جودة التجميع: الإجماع الحالي هو أن 1) يمكن أن تختلف جودة التجميع تبعًا للمقياس المستخدم، 2) التجميعات التي سجلت جيدًا في أحد الأنواع لا تؤدي بالضرورة أداءً جيدًا في الأنواع الأخرى، و3) قد يؤدي الجمع بين الطرق المختلفة إلى كن الأكثر موثوقية.[66] [67]

التعبير الجيني الكمي

يتم التعبير عن التعبير الكمي لدراسة التغيرات الخلوية استجابةً للمنبهات الخارجية، الاختلافات بين الحالات الصحية والمرضية، وغيرها من الأسئلة البحثية. غالبًا ما يستخدم تعبير الجين كبديل لوفرة البروتين، لكن غالبًا ما تكون هذه العناصر غير متكافئة بسبب أحداث ما بعد النسخ مثل تدخل الحمض النووي الريبي وانحلال بوساطة الهراء.[68]

يتم تحديد التعبير عن طريق حساب عدد القراءات التي تم تعيينها لكل موقع في خطوة التجميع transcriptome. يمكن قياس التعبير عن الإكسونات أو الجينات باستخدام contigs أو التعليقات التوضيحية المرجعية. [8] تم التحقق من صحة تعدادات RNA-Seq التي تمت ملاحظتها بقوة ضد التقنيات القديمة، بما في ذلك المصفوفات الدقيقة التعبير وqPCR . [46] [69] من الأمثلة على الأدوات التي تحدد التعدادات HTSeq ، [70] FeatureCounts ، [71] Rcount ، [72] maxcounts ، [73] FIXSEQ ، [74] و Cuffquant. ثم يتم تحويل عدد القراءة إلى مقاييس مناسبة لاختبار الفرضيات والانحدارات والتحليلات الأخرى. المعلمات لهذا التحويل هي:

  • العمق / التغطية المتسلسلة: على الرغم من أن العمق محدد مسبقًا عند إجراء تجارب RNA-Seq متعددة، إلا أنه سيظل متباينًا على نطاق واسع بين التجارب.[75] لذلك، عادةً ما يتم تطبيع إجمالي عدد القراءات التي تم إنشاؤها في تجربة واحدة عن طريق تحويل التعدادات إلى أجزاء أو قراءات أو تعدادات لكل مليون قراءة معيّنة FPM أو RPM أو CPM يشار إلى عمق التسلسل أحيانًا بحجم المكتبة، وعدد جزيئات cDNA الوسيطة في التجربة.
  • طول الجينات: سيكون للجينات الأطول شظايا / قراءات / تعدادات أكثر من الجينات الأقصر إذا كان تعبير النص الجيني هو نفسه. يتم ضبط هذا عن طريق تقسيم FPM على طول الجين، مما يؤدي إلى شظايا متري لكل كيلوبايت من النص لكل مليون قراءة المعينة (FPKM).[76] عند النظر إلى مجموعات من الجينات عبر العينات، يتم تحويل FPKM إلى نصوص لكل مليون (TPM) عن طريق تقسيم كل FPKM على مجموع FPKMs داخل عينة.[77] [78]
  • مجموع عينة الحمض النووي الريبي: لأن نفس كمية الحمض النووي الريبي المستخرجة من كل عينة، فإن العينات ذات الحمض النووي الريبي الإجمالي أكثر سيكون لها عدد أقل من الحمض النووي الريبي لكل جين. يبدو أن هذه الجينات قد قللت من التعبير، مما أدى إلى إيجابيات كاذبة في التحليلات النهائية.
  • تباين تعبير كل جين: يتم تصميمه ليتم حسابه على خطأ أخذ العينات (مهم للجينات ذات التعداد المنخفض للقراءة)، ويزيد الطاقة، ويقلل من الإيجابيات الخاطئة. يمكن تقدير التباين كتوزيع طبيعي، أو بواسون، أو سلبي ذو حدين [79] [80] [81] وغالبًا ما يتحلل إلى تباين تقني وبيولوجي.

الكم المطلق

الكم المطلق للتعبير الجيني غير ممكن في معظم تجارب RNA-Seq، والتي تقيس التعبير بالنسبة لجميع النصوص الجينية. من الممكن عن طريق إجراء RNA-Seq مع spike-ins، عينات من RNA بتركيزات معروفة. بعد التسلسل، يتم استخدام التعدادات المقروءة لتسلسلات الزيادة في تحديد العلاقة بين تعدادات القراءة لكل جين والكميات المطلقة من الأجزاء البيولوجية. [11] [82] في أحد الأمثلة، تم استخدام هذه التقنية في أجنة Xenopus المدارية لتحديد حركية النسخ.[83]

التعبير (النسخ) التفاضلي

إن الاستخدام البسيط والأقوى في كثير من الأحيان لـ RNA-Seq هو إيجاد اختلافات في التعبير الجيني بين شرطين أو أكثر (على سبيل المثال، المعالجة مقابل غير المعالجة)؛ وتسمى هذه العملية التعبير التفاضلي. يشار إلى المخرجات بشكل متكرر على أنها جينات معبر عنها تفاضليًا (DEGs) ويمكن أن يتم تنظيم هذه الجينات إما إلى أعلى أو أسفل (أي، أعلى أو أقل في حالة الاهتمام). هناك العديد من الأدوات التي تؤدي تعبيرًا تفاضليًا. يتم تشغيل معظمها في R أو Python أو سطر أوامر Unix . الأدوات الشائعة الاستخدام تشمل DESeq ، [80] edgeR ، [81] و voom + limma ، [79] [84] وكلها متوفرة من خلال موصل R / Bioconductor.[85] [86] هذه هي الاعتبارات الشائعة عند تنفيذ التعبير التفاضلي:

  • المدخلات: تشمل مدخلات التعبير التفاضلي (1) مصفوفة تعبير RNA-Seq (جينات M X × عينات) و (2) مصفوفة تصميم تحتوي على ظروف تجريبية لعينات N. تحتوي أبسط مصفوفة التصميم على عمود واحد ، يقابل التسميات للحالة التي يجري اختبارها. يمكن أن تشمل المتغيرات الأخرى (يشار إليها أيضًا بعوامل أو ميزات أو تسميات أو معلمات) تأثيرات الدُفعات والمصنوعات المعروفة وأي بيانات وصفية قد تربك أو تتوسط في التعبير الجيني. بالإضافة إلى المتغيرات المشتركة المعروفة ، يمكن أيضًا تقدير المتغيرات المشتركة غير المعروفة من خلال أساليب التعلم الآلي غير الخاضعة للإشراف بما في ذلك تحليلات المكون الرئيسي والمتغير البديل [87] و PEER.[47] غالبًا ما تستخدم التحليلات المتغيرة المخفية لبيانات RNA-Seq الخاصة بالأنسجة البشرية ، والتي تحتوي عادةً على قطع أثرية إضافية لم يتم التقاطها في البيانات الوصفية (على سبيل المثال ، الوقت الإقفاري ، الاستعانة بمؤسسات متعددة ، السمات السريرية الأساسية ، جمع البيانات عبر العديد من السنوات مع العديد من الموظفين).
  • الطرق: تستخدم معظم الأدوات إحصائيات الانحدار أو غير البارامترية لتحديد الجينات التي يتم التعبير عنها تفاضليًا ، وتكون إما قائمة على العد (DESeq2 ، limma ، edgeR) أو قائمة على التجميع (عن طريق القياس الكمي بدون محاذاة ، أو الكلب ، [88] [89] Cuffdiff ، [88] Ballgown [90]).[91] بعد الانحدار ، تستخدم معظم الأدوات إما معدل الخطأ العائلي (FWER) أو تعديلات قيمة الاكتشاف الخاطئ (FDR) لمراعاة الفرضيات المتعددة (في الدراسات البشرية ، ~ 20000 من جينات ترميز البروتين أو ~ 50000 نموذج حيوي).
  • المخرجات: يتكون المخرج النموذجي من صفوف تتوافق مع عدد الجينات وثلاثة أعمدة على الأقل، يتغير كل سجل من الجينات (تحويل سجل لنسبة التعبير في الظروف بين، مقياس حجم التأثير)، قيمة p، وp القيمة تعديلها لمقارنات متعددة. يتم تعريف الجينات على أنها ذات معنى من الناحية البيولوجية إذا نجحت في تحديد حجم التأثير (تغيير طية السجل) والأهمية الإحصائية. يجب تحديد هذه القطع بشكل مسبق بشكل مسبق، ولكن طبيعة تجارب RNA-Seq غالبًا ما تكون استكشافية، لذا يصعب التنبؤ بأحجام التأثير والقطع ذات الصلة في وقت مبكر.
  • مطبات: سبب وجود هذه الأساليب المعقدة هو تجنب عدد لا يحصى من المزالق التي يمكن أن تؤدي إلى أخطاء إحصائية وتفسيرات مضللة. المطبات تشمل زيادة معدلات إيجابية كاذبة (بسبب المقارنات المتعددة)، والتحف إعداد العينات، وعدم تجانس العينة (مثل الخلفيات الوراثية المختلطة)، وعينات مترابطة للغاية، في عداد المفقودين للتصاميم التجريبية متعددة المستويات، والتصميم التجريبي الفقراء. أحد الأخطاء البارزة هو عرض النتائج في Microsoft Excel.[92] على الرغم من أنه مناسب، يقوم Excel تلقائيًا بتحويل بعض أسماء الجينات SEPT1 وDEC1 وMARCH2 إلى تواريخ أو أرقام الفاصلة العائمة.
  • اختيار الأدوات والقياس: هناك العديد من الجهود التي تقارن نتائج هذه الأدوات، حيث تميل DESeq2 إلى التفوق بشكل معتدل على الطرق الأخرى.[93] [94] [95] [96] [97] [98] كما هو الحال مع الطرق الأخرى، يتكون القياس من مقارنة مخرجات الأداة مع بعضها البعض ومعاييرgolden المعروف.

تحاليل الدارجة للحصول على قائمة من الجينات المعبر عنها تفاضليًا تأتي في اثنين من النكهات، التحقق من صحة الملاحظات والاستدلال البيولوجي. نظرًا لمخاطر التعبير التفاضلي وRNA-Seq، يتم تكرار الملاحظات المهمة باستخدام (1) طريقة متعامدة في نفس العينات (مثل PCR في الوقت الفعلي) أو (2) تجربة أخرى، مسجلة مسبقًا في بعض الأحيان، في مجموعة جديدة. هذا الأخير يساعد على ضمان التعميم ويمكن متابعته عادةً مع التحليل التلوي لجميع الأفواج المجمعة. الطريقة الأكثر شيوعًا للحصول على فهم بيولوجي عالي المستوى للنتائج هي تحليل التخصيب الجيني، على الرغم من أنه يتم أحيانًا استخدام طرق الجينات المرشحة. يحدد إثراء مجموعة الجينات ما إذا كان التداخل بين مجموعتين من الجينات ذا دلالة إحصائية، وفي هذه الحالة يكون التداخل بين الجينات ومجموعات الجينات التي يتم التعبير عنها تفاضليًا من مسارات / قواعد البيانات المعروفة (مثل، الجينات الأنطولوجية، KEGG، الأنثروبولوجيا البشرية للأنماط) أو من التحليلات التكميلية في التحليل الجيني نفس البيانات (مثل شبكات التعبير المشترك). تشمل الأدوات الشائعة لإثراء مجموعة الجينات واجهات الويب (مثل، ENRICHR، g: profiler) وحزم البرامج. عند تقييم نتائج التخصيب، يكون أحد الأساليب البحثية هو البحث أولاً عن إثراء البيولوجيا المعروفة كتحقق من الصحة ومن ثم توسيع النطاق للبحث عن بيولوجيا جديدة.

انواع الربط ل RNA البديل. يتم تمثيل Exons ككتل زرقاء وصفراء ، والإنترونات كخطوط بينهما.

الربط البديل

الربط بين الحمض النووي الريبي جزء لا يتجزأ من حقيقيات النوى ويسهم بشكل كبير في تنظيم البروتين وتنوعه، حيث يحدث في أكثر من 90 ٪ من الجينات البشرية.[99] هناك عدة طرق بديلة للتشكيل: تخطي exon وضع الربط الأكثر شيوعًا في البشر ونواة حقيقيات النوى أعلى، exons حصرية متبادلة، ومتبرع بديل أو مواقع متقبلة، والاحتفاظ بالإنترون (وضع الربط الأكثر شيوعًا في النباتات، والفطريات، والبروتوزوا) الموقع (المروج)، والبوليدينيل البديل. أحد أهداف RNA-Seq هو تحديد أحداث الربط البديلة والاختبار إذا كانت تختلف بين الظروف. تسلسل القراءة الطويلة يلتقط النص الكامل، وبالتالي يقلل من العديد من القضايا في تقدير وفرة isoform، مثل تعيين قراءة غامضة. بالنسبة لقراءة RNA-Seq القصيرة، هناك طرق متعددة لاكتشاف الربط البديل الذي يمكن تصنيفه إلى ثلاث مجموعات رئيسية: [100] [101] [102]

  • قائم على العد (أيضًا قائم على الأحداث ، الربط التفاضلي): تقدير استبقاء الإكسون. ومن الأمثلة على ذلك DEXSeq ، [103] MATS ، [104] و SeqGSEA.[105]
  • قائم على Isoform (أيضًا وحدات متعددة القراءة ، التعبير التفاضلي isoform) : تقدير الوفرة isoform أولاً ، ثم الوفرة النسبية بين الشروط. الأمثلة على ذلك هي Cufflinks 2 [106] و DiffSplice.[107]
  • الختان على أساس Intron: حساب الربط البديل باستخدام تقسيم القراءة. ومن الأمثلة على ذلك MAJIQ [108] و Leafcutter. [102]

يمكن أيضًا استخدام أدوات التعبير الجيني التفاضلي للتعبير التفاضلي isoform إذا تم قياس الأشكال الإسوية مسبقًا مع أدوات أخرى مثل RSEM.[109]

شبكات التعبير (النسخ) المساعد

شبكات التعبير (النسخ) المساعد هي تمثيلات مستمدة من البيانات من الجينات تتصرف بطريقة مماثلة عبر الأنسجة والظروف التجريبية.[110] يكمن هدفهم الرئيسي في توليد الفرضيات وأساليب الذنب من جانب الجمعيات لاستنتاج وظائف الجينات غير المعروفة سابقًا. تم استخدام بيانات RNA-Seq لاستنتاج الجينات المشاركة في مسارات محددة تعتمد على ارتباط بيرسون، سواء في النباتات [111] والثدييات.[112] الميزة الرئيسية لبيانات RNA-Seq في هذا النوع من التحليل عبر منصات ميكروأري هي القدرة على تغطية النص بأكمله، مما يتيح إمكانية كشف تمثيلات أكثر اكتمالا لشبكات تنظيم الجينات. يمكن الكشف عن التنظيم التفريقي لعناصر الشكل العظمية للجنس نفسه واستخدامها للتنبؤ ووظائفها البيولوجية.[113] [114] تم بنجاح استخدام تحليل شبكة التعبير المشترك للجينة الموزونة لتحديد الوحدات النمطية للتعبير المشترك والجينات المحورية داخل العضل على بيانات الحمض النووي الريبي. قد تتوافق وحدات التعبير المشترك مع أنواع الخلايا أو المسارات. يمكن تفسير لوحات الوصل الفائقة المتصلة ببعضها البعض كممثلين لوحدة كل منها. إن eigengene هو عبارة عن مجموع مرجح للتعبير عن جميع الجينات في وحدة نمطية. Eigengenes هي علامات حيوية مفيدة (ميزات) للتشخيص والتشخيص.[115] تم اقتراح مناهج تحويل التباين المستقر لتقدير معاملات الارتباط بناءً على بيانات RNA seq.

اكتشاف البديل

يلتقط RNA-Seq تباين الحمض النووي، بما في ذلك متغيرات النوكليوتيدات الفردية والإدخالات الصغيرة / الحذف. والتباين الهيكلي. يشبه استدعاء المتغير في RNA-Seq استدعاء متغير الحمض النووي، وغالبًا ما يستخدم نفس الأدوات (بما في ذلك SAMtools mpileup [116] و GATK HaplotypeCaller [117]) مع تعديلات لحساب الربط. أحد الأبعاد الفريدة لمتغيرات الحمض النووي الريبي هو التعبير الخاص بالأليل (ASE): قد يتم التعبير عن المتغيرات من النمط الفرداني واحد بشكل تفضيلي بسبب التأثيرات التنظيمية بما في ذلك البصمة والتعبير عن موقع السمات الكمية، والمتغيرات النادرة غير المشفرة.[118] [119] تتضمن حدود تحديد متغير الحمض النووي الريبي (RNA) أنه يعكس فقط المناطق المعبر عنها (عند البشر، <5٪ من الجينوم) ولديه جودة أقل مقارنة بتسلسل الحمض النووي المباشر.

تحرير الحمض النووي الريبي (التعديلات بعد النسخ)

يمكن أن يساعد وجود تسلسلات مطابقة للجينوم والنسخ للفرد في الكشف عن التعديلات بعد النسخ (تحرير RNA). [3] يتم تحديد حدث تعديل ما بعد النسخ إذا كان نص الجين يحتوي على أليل / متغير لم يلاحظ في البيانات الجينية.

تعيين RNA-Seq للقراءات القصيرة على تقاطعات exon-exon ، اعتمادًا على المكان الذي تعين فيه كل نهاية ، يمكن تعريفه بأنه حدث Trans أو Cis .

كشف الجينات الانصهار

بسبب التعديلات الهيكلية المختلفة في الجينوم، اكتسبت جينات الاندماج الانتباه بسبب علاقتها بالسرطان.[120] إن قدرة RNA-Seq على تحليل النص الكامل للعينة بطريقة غير متحيزة تجعلها أداة جذابة للعثور على هذه الأنواع من الأحداث الشائعة في السرطان. [4]

وتأتي الفكرة من عملية محاذاة القراءات النصية القصيرة إلى الجينوم المرجعي. ستقع معظم القراءات القصيرة ضمن إكسون واحد كامل، ومن المتوقع أن تحدد مجموعة أصغر ولكن لا تزال كبيرة على تقاطعات إكسون المعروفة. عندئذٍ، سيتم تحليل القراءات القصيرة المتبقية غير المعينة لتحديد ما إذا كانت تتطابق مع تقاطع إكسون حيث يأتي الإكسون من جينات مختلفة. قد يكون هذا دليلًا على حدوث اندماج محتمل، ولكن نظرًا لطول القراءات، فقد يكون هذا مزدحم للغاية. هناك طريقة بديلة تتمثل في استخدام قراءات نهاية الزوج، عندما يقوم عدد كبير يحتمل من القراءات المقترنة بتعيين كل طرف إلى إكسون مختلف، مما يوفر تغطية أفضل لهذه الأحداث ومع ذلك، فإن النتيجة النهائية تتكون من مجموعات متعددة وربما جديدة من الجينات توفر نقطة انطلاق مثالية لمزيد من التحقق من الصحة. 

التاريخ

لا يزال عدد المخطوطات في PubMed الذي يضم RNA-Seq في ازدياد.

تم تطوير RNA-Seq لأول مرة في منتصف عام 2000 مع ظهور تقنية التسلسل من الجيل التالي.[121] تتضمن المخطوطات الأولى التي استخدمت RNA-Seq حتى بدون استخدام المصطلح تلك الخاصة بخطوط خلايا سرطان البروستاتا [122] (بتاريخ 2006)، و Medicago truncatula [123] (2006)، والذرة [124] (2007)، و Arabidopsis thaliana [125] (2007)، في حين أن مصطلح "RNA-Seq" نفسه ذكر لأول مرة في عام 2008.[126] يزداد عدد المخطوطات التي تشير إلى RNA-Seq في العنوان أو الملخص (الشكل ، الخط الأزرق) بشكل مستمر مع 6754 مخطوطة نشرت في عام 2018 (رابط للبحث في PubMed). تقاطع RNA-Seq والدواء (الشكل ، الخط الذهبي ، رابط البحث في النشرات الطبية PubMed) له مرونة مماثلة.   ] [ البحث الأصلي؟

تطبيقات على الطب

RNA-Seq لديه القدرة على تحديد البيولوجيا المرضية الجديدة ، المؤشرات الحيوية الشخصية للمؤشرات السريرية ، استنتاج مسارات قابلة للتخدير ، وجعل التشخيص الوراثي. يمكن تخصيص هذه النتائج بشكل أكبر للمجموعات الفرعية أو حتى للمرضى الأفراد، مما قد يؤدي إلى تسليط الضوء على المزيد من الوقاية الفعالة والتشخيص والعلاج. تملي جدوى هذا النهج جزئياً التكاليف في المال والوقت؛ أحد القيود ذات الصلة هو فريق المتخصصين المطلوب (خبراء المعلومات الحيوية والأطباء / الأطباء والباحثون الأساسيون والفنيون) لتفسير كامل الكم الهائل من البيانات الناتجة عن هذا التحليل.

جهود التسلسل الجيني على نطاق واسع

تم التركيز بشكل كبير على بيانات RNA-Seq بعد أن استخدمت مشاريع موسوعة عناصر الحمض النووي (ENCODE) وأطلس سرطان الجينوم (TCGA) هذا النهج لتوصيف عشرات من خطوط الخلايا [127] وآلاف من عينات الورم الأولية، [128] على التوالي. تهدف ENCODE إلى تحديد المناطق التنظيمية على نطاق الجينوم في مجموعة مختلفة من خطوط الخلايا والبيانات transcriptomic هي الأهم من أجل فهم تأثير المصب لتلك الطبقات التنظيمية الجينية والوراثية. يهدف TCGA، بدلاً من ذلك، إلى جمع وتحليل آلاف من عينات المرضى من 30 نوعًا مختلفًا من الأورام من أجل فهم الآليات الأساسية للتحول والتطور الخبيث. في هذا السياق، توفر بيانات RNA-Seq لقطة فريدة للحالة النصية للمرض وتنظر إلى مجموعة غير متحيزة من النصوص التي تسمح بتحديد النصوص الجديدة ونصوص الاندماج وRNA غير المشفرة التي يمكن اكتشافها باستخدام تقنيات مختلفة.

المراجع

  1. ^ Shafee, Thomas; Lowe, Rohan (2017). "Eukaryotic and prokaryotic gene structure". WikiJournal of Medicine (بEnglish). 4 (1). DOI:10.15347/wjm/2017.002.
  2. ^ "RNA sequencing: platform selection, experimental design, and data interpretation". Nucleic Acid Therapeutics. ج. 22 ع. 4: 271–4. أغسطس 2012. DOI:10.1089/nat.2012.0367. PMID:22830413. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  3. ^ أ ب ت "RNA-Seq: a revolutionary tool for transcriptomics". Nature Reviews. Genetics. ج. 10 ع. 1: 57–63. يناير 2009. DOI:10.1038/nrg2484. PMID:19015660. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  4. ^ أ ب "Transcriptome sequencing to detect gene fusions in cancer". Nature. ج. 458 ع. 7234: 97–101. مارس 2009. Bibcode:2009Natur.458...97M. DOI:10.1038/nature07638. PMID:19136943. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  5. ^ "The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments". Nature Protocols. ج. 7 ع. 8: 1534–50. يوليو 2012. DOI:10.1038/nprot.2012.086. PMID:22836135. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  6. ^ "Highly multiplexed subcellular RNA sequencing in situ". Science. ج. 343 ع. 6177: 1360–3. مارس 2014. Bibcode:2014Sci...343.1360L. DOI:10.1126/science.1250212. PMID:24578530. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  7. ^ "RNA Sequencing and Analysis". Cold Spring Harbor Protocols. ج. 2015 ع. 11: 951–69. أبريل 2015. DOI:10.1101/pdb.top084970. PMID:25870306. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  8. ^ أ ب ت ث ج "Informatics for RNA Sequencing: A Web Resource for Analysis on the Cloud". PLoS Computational Biology. ج. 11 ع. 8: e1004393. أغسطس 2015. Bibcode:2015PLSCB..11E4393G. DOI:10.1371/journal.pcbi.1004393. PMID:26248053. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  9. ^ "RNA-seqlopedia". rnaseq.uoregon.edu. مؤرشف من الأصل في 2019-12-30. اطلع عليه بتاريخ 2017-02-08.
  10. ^ "Profiling the HeLa S3 transcriptome using randomly primed cDNA and massively parallel short-read sequencing". BioTechniques. ج. 45 ع. 1: 81–94. يوليو 2008. DOI:10.2144/000112900. PMID:18611170. مؤرشف من الأصل في 2019-03-31. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  11. ^ أ ب "Mapping and quantifying mammalian transcriptomes by RNA-Seq". Nature Methods. ج. 5 ع. 7: 621–8. يوليو 2008. DOI:10.1038/nmeth.1226. PMID:18516045.
  12. ^ "Effect of RNA integrity on uniquely mapped reads in RNA-Seq". BMC Research Notes. ج. 7 ع. 1: 753. أكتوبر 2014. DOI:10.1186/1756-0500-7-753. PMID:25339126. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  13. ^ "Quantitative comparison of EST libraries requires compensation for systematic biases in cDNA generation". BMC Bioinformatics. ج. 7: 77. فبراير 2006. DOI:10.1186/1471-2105-7-77. PMID:16503995. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  14. ^ "Highly parallel direct RNA sequencing on an array of nanopores". Nature Methods. ج. 15 ع. 3: 201–206. مارس 2018. DOI:10.1038/nmeth.4577. PMID:29334379. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  15. ^ أ ب ""Single-cell sequencing-based technologies will revolutionize whole-organism science". Nature Reviews. Genetics. ج. 14 ع. 9: 618–30. سبتمبر 2013. DOI:10.1038/nrg3542. PMID:23897237."
  16. ^ "The technology and biology of single-cell RNA sequencing". Molecular Cell. ج. 58 ع. 4: 610–20. مايو 2015. DOI:10.1016/j.molcel.2015.04.005. PMID:26000846.
  17. ^ "A revised airway epithelial hierarchy includes CFTR-expressing ionocytes". Nature. ج. 560 ع. 7718: 319–324. أغسطس 2018. Bibcode:2018Natur.560..319M. DOI:10.1038/s41586-018-0393-7. PMID:30069044. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  18. ^ "A single-cell atlas of the airway epithelium reveals the CFTR-rich pulmonary ionocyte". Nature. ج. 560 ع. 7718: 377–381. أغسطس 2018. Bibcode:2018Natur.560..377P. DOI:10.1038/s41586-018-0394-6. PMID:30069046. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  19. ^ "Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells". Cell. ج. 161 ع. 5: 1187–1201. مايو 2015. DOI:10.1016/j.cell.2015.04.044. PMID:26000487. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  20. ^ "Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets". Cell. ج. 161 ع. 5: 1202–1214. مايو 2015. DOI:10.1016/j.cell.2015.05.002. PMID:26000488. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  21. ^ ""Methods, Challenges and Potentials of Single Cell RNA-seq". Biology. ج. 1 ع. 3: 658–67. نوفمبر 2012. DOI:10.3390/biology1030658. PMID:24832513. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)"
  22. ^ "The promise of single-cell sequencing". Nature Methods. ج. 11 ع. 1: 25–7. يناير 2014. DOI:10.1038/nmeth.2769. PMID:24524134.
  23. ^ "mRNA-Seq whole-transcriptome analysis of a single cell". Nature Methods. ج. 6 ع. 5: 377–82. مايو 2009. DOI:10.1038/NMETH.1315. PMID:19349980. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  24. ^ "Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq". Genome Research. ج. 21 ع. 7: 1160–7. يوليو 2011. DOI:10.1101/gr.110882.110. PMID:21543516. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  25. ^ "Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells". Nature Biotechnology. ج. 30 ع. 8: 777–82. أغسطس 2012. DOI:10.1038/nbt.2282. PMID:22820318. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  26. ^ "CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification". Cell Reports. ج. 2 ع. 3: 666–73. سبتمبر 2012. DOI:10.1016/j.celrep.2012.08.003. PMID:22939981.
  27. ^ "High-throughput targeted long-read single cell sequencing reveals the clonal and transcriptional landscape of lymphocytes". bioRxiv. 2018. DOI:10.1101/424945.
  28. ^ "Quartz-Seq: a highly reproducible and sensitive single-cell RNA sequencing method, reveals non-genetic gene-expression heterogeneity". Genome Biology. ج. 14 ع. 4: R31. أبريل 2013. DOI:10.1186/gb-2013-14-4-r31. PMID:23594475. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  29. ^ "C1 CAGE detects transcription start sites and enhancer activity at single-cell resolution". Nature Communications. ج. 10 ع. 1: 360. يناير 2019. Bibcode:2019NatCo..10..360K. DOI:10.1038/s41467-018-08126-5. PMID:30664627. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  30. ^ "How to design a single-cell RNA-sequencing experiment: pitfalls, challenges and perspectives". Briefings in Bioinformatics: bby007. يناير 2018. DOI:10.1093/bib/bby007. PMID:29394315.
  31. ^ "Multiplexed quantification of proteins and transcripts in single cells". Nature Biotechnology. ج. 35 ع. 10: 936–939. أكتوبر 2017. DOI:10.1038/nbt.3973. PMID:28854175. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  32. ^ "Simultaneous epitope and transcriptome measurement in single cells". Nature Methods. ج. 14 ع. 9: 865–868. سبتمبر 2017. DOI:10.1038/nmeth.4380. PMID:28759029. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  33. ^ "Simultaneous single-cell profiling of lineages and cell types in the vertebrate brain". Nature Biotechnology. ج. 36 ع. 5: 442–450. يونيو 2018. DOI:10.1038/nbt.4103. PMID:29608178. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  34. ^ "Circulating tumour cell (CTC) counts as intermediate end points in castration-resistant prostate cancer (CRPC): a single-centre experience". Annals of Oncology. ج. 20 ع. 1: 27–33. يناير 2009. DOI:10.1093/annonc/mdn544. PMID:18695026. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  35. ^ "Single-Cell Transcriptomic Analysis of Tumor Heterogeneity". Trends in Cancer (بالإنجليزية). 4 (4): 264–268. Apr 2018. DOI:10.1016/j.trecan.2018.02.003. PMID:29606308. Archived from the original on 2020-05-11. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)
  36. ^ "A Cancer Cell Program Promotes T Cell Exclusion and Resistance to Checkpoint Blockade". Cell (بالإنجليزية). 175 (4): 984–997.e24. Nov 2018. DOI:10.1016/j.cell.2018.09.006. PMID:30388455. Archived from the original on 2020-05-11. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (help) and الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)
  37. ^ "Single-cell RNA-seq of rheumatoid arthritis synovial tissue using low-cost microfluidic instrumentation". Nature Communications. ج. 9 ع. 1: 791. فبراير 2018. Bibcode:2018NatCo...9..791S. DOI:10.1038/s41467-017-02659-x. PMID:29476078. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  38. ^ "Pathogen Cell-to-Cell Variability Drives Heterogeneity in Host Immune Responses". Cell. ج. 162 ع. 6: 1309–21. سبتمبر 2015. DOI:10.1016/j.cell.2015.08.027. PMID:26343579. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  39. ^ "Comprehensive single-cell transcriptional profiling of a multicellular organism". Science. ج. 357 ع. 6352: 661–667. أغسطس 2017. Bibcode:2017Sci...357..661C. DOI:10.1126/science.aam8940. PMID:28818938. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  40. ^ "Cell type atlas and lineage tree of a whole complex animal by single-cell transcriptomics". Science. ج. 360 ع. 6391: eaaq1723. مايو 2018. DOI:10.1126/science.aaq1723. PMID:29674432. مؤرشف من الأصل في 2020-05-11. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  41. ^ "Schmidtea mediterranea". Science. ج. 360 ع. 6391: eaaq1736. مايو 2018. DOI:10.1126/science.aaq1736. PMID:29674431. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  42. ^ "Single-cell mapping of gene expression landscapes and lineage in the zebrafish embryo". Science. ج. 360 ع. 6392: 981–987. يونيو 2018. Bibcode:2018Sci...360..981W. DOI:10.1126/science.aar4362. PMID:29700229. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  43. ^ "Single-cell reconstruction of developmental trajectories during zebrafish embryogenesis". Science. ج. 360 ع. 6392: eaar3131. يونيو 2018. DOI:10.1126/science.aar3131. PMID:29700225. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  44. ^ "The dynamics of gene expression in vertebrate embryogenesis at single-cell resolution". Science. ج. 360 ع. 6392: eaar5780. يونيو 2018. DOI:10.1126/science.aar5780. PMID:29700227. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  45. ^ You، Jia. "Science's 2018 Breakthrough of the Year: tracking development cell by cell". Science Magazine. American Association for the Advancement of Science. مؤرشف من الأصل في 2019-12-06.
  46. ^ أ ب "Determination of tag density required for digital transcriptome analysis: application to an androgen-sensitive prostate cancer model". Proceedings of the National Academy of Sciences of the United States of America. ج. 105 ع. 51: 20179–84. ديسمبر 2008. Bibcode:2008PNAS..10520179L. DOI:10.1073/pnas.0807121105. PMID:19088194. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  47. ^ أ ب "Using probabilistic estimation of expression residuals (PEER) to obtain increased power and interpretability of gene expression analyses". Nature Protocols. ج. 7 ع. 3: 500–7. فبراير 2012. DOI:10.1038/nprot.2011.457. PMID:22343431. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  48. ^ "Reference-based compression of short-read sequences using path encoding". Bioinformatics. ج. 31 ع. 12: 1920–8. يونيو 2015. DOI:10.1093/bioinformatics/btv071. PMID:25649622. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  49. ^ "Full-length transcriptome assembly from RNA-Seq data without a reference genome". Nature Biotechnology. ج. 29 ع. 7: 644–52. مايو 2011. DOI:10.1038/nbt.1883. PMID:21572440. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  50. ^ "De Novo Assembly Using Illumina Reads" (PDF). مؤرشف من الأصل (PDF) في 2019-04-30. اطلع عليه بتاريخ 2016-10-22.
  51. ^ "Velvet: algorithms for de novo short read assembly using de Bruijn graphs". Genome Research. ج. 18 ع. 5: 821–9. مايو 2008. DOI:10.1101/gr.074492.107. PMID:18349386. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  52. ^ Oases: a transcriptome assembler for very short reads نسخة محفوظة 29 نوفمبر 2018 على موقع واي باك مشين.
  53. ^ "Bridger: a new framework for de novo transcriptome assembly using RNA-seq data". Genome Biology. ج. 16 ع. 1: 30. فبراير 2015. DOI:10.1186/s13059-015-0596-2. PMID:25723335. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  54. ^ أ ب "Evaluation of de novo transcriptome assemblies from RNA-Seq data". Genome Biology. ج. 15 ع. 12: 553. ديسمبر 2014. DOI:10.1186/s13059-014-0553-5. PMID:25608678. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  55. ^ "STAR: ultrafast universal RNA-seq aligner". Bioinformatics. ج. 29 ع. 1: 15–21. يناير 2013. DOI:10.1093/bioinformatics/bts635. PMID:23104886. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  56. ^ "Ultrafast and memory-efficient alignment of short DNA sequences to the human genome". Genome Biology. ج. 10 ع. 3: R25. 2009. DOI:10.1186/gb-2009-10-3-r25. PMID:19261174. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  57. ^ "TopHat: discovering splice junctions with RNA-Seq". Bioinformatics. ج. 25 ع. 9: 1105–11. مايو 2009. DOI:10.1093/bioinformatics/btp120. PMID:19289445. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  58. ^ "Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks". Nature Protocols. ج. 7 ع. 3: 562–78. مارس 2012. DOI:10.1038/nprot.2012.016. PMID:22383036. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  59. ^ "The Subread aligner: fast, accurate and scalable read mapping by seed-and-vote". Nucleic Acids Research. ج. 41 ع. 10: e108. مايو 2013. DOI:10.1093/nar/gkt214. PMID:23558742. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  60. ^ "HISAT: a fast spliced aligner with low memory requirements". Nature Methods. ج. 12 ع. 4: 357–60. أبريل 2015. DOI:10.1038/nmeth.3317. PMID:25751142. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  61. ^ "Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms". Nature Biotechnology. ج. 32 ع. 5: 462–4. مايو 2014. arXiv:1308.3700. DOI:10.1038/nbt.2862. PMID:24752080. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  62. ^ "Near-optimal probabilistic RNA-seq quantification". Nature Biotechnology. ج. 34 ع. 5: 525–7. مايو 2016. DOI:10.1038/nbt.3519. PMID:27043002.
  63. ^ "GMAP: a genomic mapping and alignment program for mRNA and EST sequences". Bioinformatics. ج. 21 ع. 9: 1859–75. مايو 2005. DOI:10.1093/bioinformatics/bti310. PMID:15728110.
  64. ^ "Simulation-based comprehensive benchmarking of RNA-seq aligners". Nature Methods (بEnglish). 14 (2): 135–139. Feb 2017. DOI:10.1038/nmeth.4106. PMID:27941783. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)
  65. ^ "Systematic evaluation of spliced alignment programs for RNA-seq data". Nature Methods (بEnglish). 10 (12): 1185–91. Dec 2013. DOI:10.1038/nmeth.2722. PMID:24185836. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (help) and الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)
  66. ^ "Comparative study of de novo assembly and genome-guided assembly strategies for transcriptome reconstruction based on RNA-Seq". Science China Life Sciences. ج. 56 ع. 2: 143–55. فبراير 2013. DOI:10.1007/s11427-013-4442-z. PMID:23393030.
  67. ^ "Assemblathon 2: evaluating de novo methods of genome assembly in three vertebrate species". GigaScience. ج. 2 ع. 1: 10. يوليو 2013. arXiv:1301.5406. Bibcode:2013arXiv1301.5406B. DOI:10.1186/2047-217X-2-10. PMID:23870653. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  68. ^ "Comparing protein abundance and mRNA expression levels on a genomic scale". Genome Biology. ج. 4 ع. 9: 117. 2003. DOI:10.1186/gb-2003-4-9-117. PMID:12952525. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  69. ^ "A comparative study of techniques for differential expression analysis on RNA-Seq data". PLOS ONE. ج. 9 ع. 8: e103207. أغسطس 2014. Bibcode:2014PLoSO...9j3207Z. DOI:10.1371/journal.pone.0103207. PMID:25119138. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  70. ^ "HTSeq--a Python framework to work with high-throughput sequencing data". Bioinformatics. ج. 31 ع. 2: 166–9. يناير 2015. DOI:10.1093/bioinformatics/btu638. PMID:25260700. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  71. ^ "featureCounts: an efficient general purpose program for assigning sequence reads to genomic features". Bioinformatics. ج. 30 ع. 7: 923–30. أبريل 2014. arXiv:1305.3347. DOI:10.1093/bioinformatics/btt656. PMID:24227677.
  72. ^ "Rcount: simple and flexible RNA-Seq read counting". Bioinformatics. ج. 31 ع. 3: 436–7. فبراير 2015. DOI:10.1093/bioinformatics/btu680. PMID:25322836.
  73. ^ "Reducing bias in RNA sequencing data: a novel approach to compute counts". BMC Bioinformatics. 15 Suppl 1 ع. Suppl 1: S7. 2014. DOI:10.1186/1471-2105-15-s1-s7. PMID:24564404. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  74. ^ "Universal count correction for high-throughput sequencing". PLoS Computational Biology. ج. 10 ع. 3: e1003494. مارس 2014. Bibcode:2014PLSCB..10E3494H. DOI:10.1371/journal.pcbi.1003494. PMID:24603409. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  75. ^ "A scaling normalization method for differential expression analysis of RNA-seq data". Genome Biology. ج. 11 ع. 3: R25. 2010. DOI:10.1186/gb-2010-11-3-r25. PMID:20196867. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  76. ^ "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology. ج. 28 ع. 5: 511–5. مايو 2010. DOI:10.1038/nbt.1621. PMID:20436464. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  77. ^ "What the FPKM? A review of RNA-Seq expression units". The farrago. 8 مايو 2014. مؤرشف من الأصل في 2019-12-30. اطلع عليه بتاريخ 2018-03-28.
  78. ^ "Measurement of mRNA abundance using RNA-seq data: RPKM measure is inconsistent among samples". Theory in Biosciences = Theorie in den Biowissenschaften. ج. 131 ع. 4: 281–5. ديسمبر 2012. DOI:10.1007/s12064-012-0162-3. PMID:22872506.
  79. ^ أ ب "voom: Precision weights unlock linear model analysis tools for RNA-seq read counts". Genome Biology. ج. 15 ع. 2: R29. فبراير 2014. DOI:10.1186/gb-2014-15-2-r29. PMID:24485249. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  80. ^ أ ب "Differential expression analysis for sequence count data". Genome Biology. ج. 11 ع. 10: R106. 2010. DOI:10.1186/gb-2010-11-10-r106. PMID:20979621. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  81. ^ أ ب "edgeR: a Bioconductor package for differential expression analysis of digital gene expression data". Bioinformatics. ج. 26 ع. 1: 139–40. يناير 2010. DOI:10.1093/bioinformatics/btp616. PMID:19910308. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  82. ^ "Quantitative analysis of fission yeast transcriptomes and proteomes in proliferating and quiescent cells". Cell. ج. 151 ع. 3: 671–83. أكتوبر 2012. DOI:10.1016/j.cell.2012.09.019. PMID:23101633. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  83. ^ "Measuring Absolute RNA Copy Numbers at High Temporal Resolution Reveals Transcriptome Kinetics in Development". Cell Reports. ج. 14 ع. 3: 632–647. يناير 2016. DOI:10.1016/j.celrep.2015.12.050. PMID:26774488. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  84. ^ "limma powers differential expression analyses for RNA-sequencing and microarray studies". Nucleic Acids Research. ج. 43 ع. 7: e47. أبريل 2015. DOI:10.1093/nar/gkv007. PMID:25605792. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  85. ^ "Bioconductor - Open source software for bioinformatics". مؤرشف من الأصل في 2019-12-29.
  86. ^ "Orchestrating high-throughput genomic analysis with Bioconductor". Nature Methods. ج. 12 ع. 2: 115–21. فبراير 2015. DOI:10.1038/nmeth.3252. PMID:25633503. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  87. ^ "Capturing heterogeneity in gene expression studies by surrogate variable analysis". PLoS Genetics. ج. 3 ع. 9: 1724–35. سبتمبر 2007. DOI:10.1371/journal.pgen.0030161. PMID:17907809. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  88. ^ أ ب "Differential analysis of gene regulation at transcript resolution with RNA-seq" (PDF). Nature Biotechnology. ج. 31 ع. 1: 46–53. يناير 2013. DOI:10.1038/nbt.2450. PMID:23222703. مؤرشف من الأصل (PDF) في 2020-05-11. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  89. ^ "Differential analysis of RNA-seq incorporating quantification uncertainty". Nature Methods. ج. 14 ع. 7: 687–690. يوليو 2017. DOI:10.1038/nmeth.4324. PMID:28581496.
  90. ^ "Ballgown bridges the gap between transcriptome assembly and expression analysis". Nature Biotechnology. ج. 33 ع. 3: 243–6. مارس 2015. DOI:10.1038/nbt.3172. PMID:25748911. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  91. ^ "Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis". Nature Communications. ج. 8 ع. 1: 59. يوليو 2017. Bibcode:2017NatCo...8...59S. DOI:10.1038/s41467-017-00050-4. PMID:28680106. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  92. ^ "Gene name errors are widespread in the scientific literature". Genome Biology. ج. 17 ع. 1: 177. أغسطس 2016. DOI:10.1186/s13059-016-1044-7. PMID:27552985. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  93. ^ "A comparison of methods for differential expression analysis of RNA-seq data". BMC Bioinformatics. ج. 14: 91. مارس 2013. DOI:10.1186/1471-2105-14-91. PMID:23497356. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  94. ^ "RNA-Seq gene profiling--a systematic empirical comparison". PLOS ONE. ج. 9 ع. 9: e107026. 30 سبتمبر 2014. Bibcode:2014PLoSO...9j7026F. DOI:10.1371/journal.pone.0107026. PMID:25268973. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  95. ^ "Comparison of software packages for detecting differential expression in RNA-seq studies". Briefings in Bioinformatics. ج. 16 ع. 1: 59–70. يناير 2015. DOI:10.1093/bib/bbt086. PMID:24300110. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  96. ^ "Comprehensive evaluation of differential gene expression analysis methods for RNA-seq data". Genome Biology. ج. 14 ع. 9: R95. 2013. DOI:10.1186/gb-2013-14-9-r95. PMID:24020486. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  97. ^ "A survey of best practices for RNA-seq data analysis". Genome Biology. ج. 17 ع. 1: 13. يناير 2016. DOI:10.1186/s13059-016-0881-8. PMID:26813401. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  98. ^ "RNA-Seq differential expression analysis: An extended review and a software tool". PLOS ONE. ج. 12 ع. 12: e0190152. 21 ديسمبر 2017. Bibcode:2017PLoSO..1290152C. DOI:10.1371/journal.pone.0190152. PMID:29267363. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  99. ^ "Alternative splicing and evolution: diversification, exon definition and function". Nature Reviews. Genetics. ج. 11 ع. 5: 345–55. مايو 2010. DOI:10.1038/nrg2776. PMID:20376054.
  100. ^ "Comparisons of computational methods for differential alternative splicing detection using RNA-seq in plant systems". BMC Bioinformatics. ج. 15 ع. 1: 364. ديسمبر 2014. DOI:10.1186/s12859-014-0364-4. PMID:25511303. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  101. ^ Pachter, Lior (19 Apr 2011). "Models for transcript quantification from RNA-Seq" (بEnglish). arXiv:1104.3889. Bibcode:2011arXiv1104.3889P. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (help)
  102. ^ أ ب "Annotation-free quantification of RNA splicing using LeafCutter". Nature Genetics. ج. 50 ع. 1: 151–158. يناير 2018. DOI:10.1038/s41588-017-0004-9. PMID:29229983. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  103. ^ "Detecting differential usage of exons from RNA-seq data". Genome Research. ج. 22 ع. 10: 2008–17. أكتوبر 2012. DOI:10.1101/gr.133744.111. PMID:22722343. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  104. ^ "MATS: a Bayesian framework for flexible detection of differential alternative splicing from RNA-Seq data". Nucleic Acids Research. ج. 40 ع. 8: e61. أبريل 2012. DOI:10.1093/nar/gkr1291. PMID:22266656. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  105. ^ "SeqGSEA: a Bioconductor package for gene set enrichment analysis of RNA-Seq data integrating differential expression and splicing". Bioinformatics. ج. 30 ع. 12: 1777–9. يونيو 2014. DOI:10.1093/bioinformatics/btu090. PMID:24535097.
  106. ^ "Differential analysis of gene regulation at transcript resolution with RNA-seq". Nature Biotechnology. ج. 31 ع. 1: 46–53. يناير 2013. DOI:10.1038/nbt.2450. PMID:23222703. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  107. ^ "DiffSplice: the genome-wide detection of differential splicing events with RNA-seq". Nucleic Acids Research. ج. 41 ع. 2: e39. يناير 2013. DOI:10.1093/nar/gks1026. PMID:23155066. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  108. ^ "A new view of transcriptome complexity and regulation through the lens of local splicing variations". eLife. ج. 5: e11752. فبراير 2016. DOI:10.7554/eLife.11752. PMID:26829591. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  109. ^ "A benchmarking of workflows for detecting differential splicing and differential expression at isoform level in human RNA-seq studies". Briefings in Bioinformatics. ج. 20 ع. 2: 471–481. مارس 2019. DOI:10.1093/bib/bbx122. PMID:29040385.
  110. ^ "A combined algorithm for genome-wide prediction of protein function". Nature. ج. 402 ع. 6757: 83–6. نوفمبر 1999. Bibcode:1999Natur.402...83M. DOI:10.1038/47048. PMID:10573421.
  111. ^ "Comparative study of RNA-seq- and microarray-derived coexpression networks in Arabidopsis thaliana". Bioinformatics. ج. 29 ع. 6: 717–24. مارس 2013. DOI:10.1093/bioinformatics/btt053. PMID:23376351.
  112. ^ "Utilizing RNA-Seq data for de novo coexpression network inference". Bioinformatics. ج. 28 ع. 12: 1592–7. يونيو 2012. DOI:10.1093/bioinformatics/bts245. PMID:22556371. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  113. ^ "Systematically differentiating functions for alternatively spliced isoforms through integrating RNA-seq data". PLoS Computational Biology. ج. 9 ع. 11: e1003314. نوفمبر 2013. Bibcode:2013PLSCB...9E3314E. DOI:10.1371/journal.pcbi.1003314. PMID:24244129. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  114. ^ "The emerging era of genomic data integration for analyzing splice isoform function". Trends in Genetics. ج. 30 ع. 8: 340–7. أغسطس 2014. DOI:10.1016/j.tig.2014.05.005. PMID:24951248. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  115. ^ "Large-scale gene network analysis reveals the significance of extracellular matrix pathway and homeobox genes in acute myeloid leukemia: an introduction to the Pigengene package and its applications". BMC Medical Genomics. ج. 10 ع. 1: 16. مارس 2017. DOI:10.1186/s12920-017-0253-6. PMID:28298217. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  116. ^ "The Sequence Alignment/Map format and SAMtools". Bioinformatics. ج. 25 ع. 16: 2078–9. أغسطس 2009. DOI:10.1093/bioinformatics/btp352. PMID:19505943. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  117. ^ "A framework for variation discovery and genotyping using next-generation DNA sequencing data". Nature Genetics. ج. 43 ع. 5: 491–8. مايو 2011. DOI:10.1038/ng.806. PMID:21478889. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  118. ^ "Genetic effects on gene expression across human tissues". Nature. ج. 550 ع. 7675: 204–213. أكتوبر 2017. Bibcode:2017Natur.550..204A. DOI:10.1038/nature24277. PMID:29022597. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  119. ^ "ORE Identifies Extreme Expression Effects Enriched for Rare Variants". Bioinformatics. مارس 2019. DOI:10.1093/bioinformatics/btz202. PMID:30903145. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة)
  120. ^ "Recurrent fusion oncogenes in carcinomas". Critical Reviews in Oncogenesis. ج. 12 ع. 3–4: 257–71. ديسمبر 2006. DOI:10.1615/critrevoncog.v12.i3-4.40. PMID:17425505.
  121. ^ "Discovering New Biology through Sequencing of RNA". Plant Physiology. ج. 169 ع. 3: 1524–31. نوفمبر 2015. DOI:10.1104/pp.15.01081. PMID:26353759. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  122. ^ "Analysis of the prostate cancer cell line LNCaP transcriptome using a sequencing-by-synthesis approach". BMC Genomics. ج. 7: 246. سبتمبر 2006. DOI:10.1186/1471-2164-7-246. PMID:17010196. {{استشهاد بدورية محكمة}}: الوسيط |إظهار المؤلفين=6 غير صالح (مساعدة) والوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  123. ^ "Sequencing Medicago truncatula expressed sequenced tags using 454 Life Sciences technology". BMC Genomics. ج. 7: 272. أكتوبر 2006. DOI:10.1186/1471-2164-7-272. PMID:17062153. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  124. ^ "Gene discovery and annotation using LCM-454 transcriptome sequencing". Genome Research. ج. 17 ع. 1: 69–73. يناير 2007. DOI:10.1101/gr.5145806. PMID:17095711. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  125. ^ "Sampling the Arabidopsis transcriptome with massively parallel pyrosequencing". Plant Physiology. ج. 144 ع. 1: 32–42. مايو 2007. DOI:10.1104/pp.107.096677. PMID:17351049. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  126. ^ "The transcriptional landscape of the yeast genome defined by RNA sequencing". Science. ج. 320 ع. 5881: 1344–9. يونيو 2008. Bibcode:2008Sci...320.1344N. DOI:10.1126/science.1158441. PMID:18451266. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  127. ^ "ENCODE Data Matrix". مؤرشف من الأصل في 2019-05-30. اطلع عليه بتاريخ 2013-07-28.
  128. ^ "The Cancer Genome Atlas - Data Portal". مؤرشف من الأصل في 2016-04-16. اطلع عليه بتاريخ 2013-07-28.