אנליזת ריצוף - Bowtie

אנליזת רצפים

Bowtie היא חבילת תוכנה נפוצה עבור עימוד רצפים ואנליזת ריצוף בביולוגיה חישובית[1].

קוד המקור של החבילה זמין ללא עלות וקבצים בינאריים מהודרים זמינים עבור פלטפורמת המחשוב: Linux, macOS ו- Windows. החל מ-2017, הכתב העת המדעי Genome Biology המתאר את השיטה המקורית של Bowtie צוטט מעל 11,000 פעמים.

Bowtie היא תוכנת קוד פתוח וכרגע מתוחזקת על ידי אוניברסיטת ג'ונס הופקינס בבולטימור ארצות הברית.

היסטוריה עריכה

תוכנת עימוד הרצפים פותחה לראשונה על ידי בן לנגמיד ושותפיו (Ben Langmead et al). באוניברסיטת מרילנד בשנת 2009. תפעול התוכנה לרוב מתבצע עם אורכי קריאה קצרים ורצף ייחוס ארוך, או עבור אנליזת גנום שלם (whole genome analysis). התוכנה משווקת כ "תוכנת עימוד לרצפי DNA קצרים אולטרה-מהירה ויעילה בזיכרון". השיפור במהירות התוכנה נובע בחלקו מיישום שיטת התמרת בורווס-וילר עבור עימוד, אשר מפחיתה את טביעת הרגל של הזיכרון- שימוש בזיכרון הגישה אקראית (בדרך כלל ישנו צורך ב-2.2 ג'יגה-בייט עבור הגנום האנושי)[2]. שיטה דומה משמשת תוכנות העימוד BWA[3] ו-SOAP2[4].

התכנה מבצעת אלגוריתם חיפוש לעומק בצורה איכותית, חמדנית ורנדומית דרך העימודים האפשריים. מפני שהחיפוש הוא חמדני, העימוד המתאים הראשון הנבחר על ידי Bowtie לאו דווקא יהיה ה'טוב ביותר' מבחינת מספר החוסר התאמות או במדדי איכות.

בנוסף, משתמשים ב-Bowtie לצורך עימוד רצפים במספר אלגוריתמים נוספים הקשורים לביולוגיה חישובית כגון TopHat[5][6]Cufflinks וחבילת CummeRbund Bioconductor[7].

חבילת Bowtie 2 עריכה

ב-16 באוקטובר 2011, מפתחי Bowtie הוציאו לאור גרסת בטא של פיצול הנקראת[8]Bowtie 2.

בנוסף לשיטת התמרת בורווס-וילר, Bowtie 2 משתמשת גם בFM-index (בדומה למערך סיפות) על מנת לשמור על טביעת הרגל של הזיכרון נמוכה. Bowtie 2 מתאימה יותר למציאת רצפים ארוכים יותר ובעלי רווחים לעומת הגרסה המקורית של Bowtie. אין חסם עליון לאורכי הרצפים ב־2 Bowtie והיא מאפשרת בעימוד הרצפים מצבים שבהם החפיפה היא דו משמעית ברצף הייחוס.

קישורים חיצוניים עריכה

הערות שוליים עריכה

  1. ^ Ben Langmead, Cole Trapnell, Mihai Pop and Steven L Salzberg, [https://genomebiology.biomedcentral.com/track/pdf/10.1186/gb-2009-10-3-r25 Ultrafast and memory-efficient alignment of short DNA sequences to the human genome], Genome Biology
  2. ^ Bowtie An ultrafast memory-efficient short read aligner, http://bowtie-bio.sourceforge.net/index.shtml, ‏29 November 2013
  3. ^ Heng Li and Richard Durbin, Fast and accurate short read alignment with Burrows–Wheeler transform, Bioinformatics
  4. ^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (3 June 2009), SOAP2: an improved ultrafast tool for short read alignment, Bioinformatics
  5. ^ Cole Trapnell, Lior Pachter, and Steven L. Salzberg, TopHat: discovering splice junctions with RNA-Seq, Bioinformatics
  6. ^ Trapnell, Cole; Roberts, Adam; Goff, Loyal; Pertea, Geo; Kim, Daehwan; Kelley, David R; Pimentel, Harold; Salzberg, Steven L; Rinn, John L; Pachter, Lior (1 March 2012), Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks, Nature Protocols
  7. ^ [http://compbio.mit.edu/cummeRbund/ CummeRbund Exploration, analysis and visualization of Cufflinks high-throughput RNA-Seq data], ‏11 August 2015
  8. ^ Langmead, Ben; Salzberg, Steven L (4 March 2012), Fast gapped-read alignment with Bowtie 2, Nature methods