معلومة

ما هو "contigs" في ReorderSAM بيكارد؟

ما هو


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لقد استخدمت BWA لتعيين قراءات NGS الخاصة بي مقابل جينوم hg38 ، ولدي ملف BAM. أنا لا أقوم بتجميع الجينوم ، وملف الجينوم المرجعي الخاص بي يحتوي على الكروموسومات البشرية. وبالتالي ، لا ينبغي أن يكون لدي "contigs". لكن…

https://broadinstitute.github.io/picard/command-line-overview.html#ReorderSam

واقتبس:

تقوم ReorderSam بإعادة ترتيب القراءة في ملف SAM / BAM لمطابقة ترتيب contig في ملف مرجعي مقدم ، كما هو محدد من خلال مطابقة الاسم تمامًا لـ contigs

س: ماذا فعلتطلب كونتيجيعني ، بالنسبة لتجربة تسلسل الجينوم الكامل الخاصة بي؟ على وجه الخصوص ، ماذا تعني مطابقة contig بملف مرجعي؟


لست على دراية بـ picard ووظيفة إعادة الترتيب الخاصة بهم ، ولكن بقدر ما أعرف / أفهم من وثائقهم ، فإنهم يقصدون هذا:
ترتيب contigs أثناء استخدام تسلسل مرجعي. مثله:

الشكل 5: تشريح تجميع الجينوم الكامل. في تجميع الجينوم الكامل ، يتم دمج شظايا BAC (مقاطع الخط الأحمر) والقراءات من خمسة أفراد (مقاطع الخط الأسود) لإنتاج كونتيج وتسلسل إجماعي (خط أخضر). يتم توصيل contigs في سقالات ، كما هو موضح باللون الأحمر ، عن طريق اقتران متواليات نهاية ، والتي تسمى أيضًا زملاء. إذا كانت هناك فجوة بين contigs المتتالية ، فلها حجم معروف. بعد ذلك ، يتم تعيين السقالات على الجينوم (الخط الرمادي) باستخدام معلومات الموقع الموسومة بالتسلسل (STS) ، ممثلة بالنجوم الزرقاء. © 2001 American Association for the Advancement of Science Venter، C. et al. تسلسل الجينوم البشري. العلوم 291 ، 1304-1351 (2001). كل الحقوق محفوظة. (مصدر)

إعادة طلب SAM (Picard) لذلك في Picard لديك ملفالمدخلات (ملف)، يتم بعد ذلك تعيين القراءات في هذا الملف على ملفمرجع (ملف). يمكن أيضًا رؤية هذا في التعليمات البرمجية الخاصة بهم:

// اكتب القراءات بترتيب مستمر 109 لـ (contig SAMSequenceRecord contig: refDict.getSequences ()) {110 final SAMRecordIterator it = in.query (contig.getSequenceName ()، 0، 0، false) ؛ 111 writeReads (out، it، newOrder، contig.getSequenceName ()) ؛ 112}

(مصدر الكود)

تقوم ReorderSam بإعادة ترتيب القراءة في ملف SAM / BAM لمطابقة ترتيب contig في ملف مرجعي متوفر

بعض المزيد من الخلفية
هناك طريقتان رئيسيتان للحصول على تسلسل الجينوم:

هناك نوعان من المقاربات "الرئيسية" لهذا:
ز. تنتج تقنيات التسلسل من الجيل الثاني الملايين من سلاسل النيوكليوتيدات القصيرة (بضع مئات من القواعد الأساسية) ، وهي مثالية لإعادة التسلسل عند تعيين القراءات إلى جينوم مرجعي (التجمع القائم على المرجع). تجميع جينوم دي نوفو على أساس تسلسل الجيل الثاني يمثل تحديًا بسبب الصعوبات في امتدادات الحمض النووي الغني بالـ GC أو AT و homonucleotide ، والتي يتم تمثيلها بشكل ناقص في إخراج التسلسل (المصدر)

خصائص هذه هي:
من جديد

  • لا تحيز تجاه الجينوم المرجعي
  • لا يوجد نموذج للتكيف معه
  • عادة ما يكون التجميع أكثر تجزئة
  • عادة ما تعمل بشكل أفضل مع الفروق واسعة النطاق / متوسطة الحجم (المصدر)


رسم الخرائط المرجعية

  • أقل contigs
  • في معظم الطرق ، لا يتم استخدام القراءات التي لم يتم تعيينها في التسلسل النهائي (هذا هو الحال أيضًا مع reorderSAM:يتم إسقاط القراءات المعينة لـ contigs الغائب في المرجع الجديد
  • تنظر إلى ما يشبه الجينوم المرجعي الخاص بك
  • يتم وضع SNPs وعمليات التحقق الصغيرة جدًا ومقارنتها بسهولة أكبر بين المجموعات (المصدر)

أوصي بشدة بمشاهدة هذه الرسوم المتحركة القصيرة للتمييز بين هذين الأمرين وفهم ماهية تعيين الجينوم المرجعي.