אונטולוגיית גנים

יוזמה ביואינפורמטית השואפת לאחד את יצוגי התכונות והתהליכים של גנים ושל תוצרי גנים בכל המינים

אונטולוגיית גניםלועזית: Gene ontology, ובראשי תיבות: GO) היא יוזמה ביואינפורמטית המאחדת את ייצוג התכונות של גנים ותוצרי גנים בכל המינים. מטרות המיזם הם[1]:

  1. לתחזק ולפתח את אוצר המילים המשמש לתיאור תכונות הגנים ותוצריהם.
  2. לבצע אנוטציה לגנים ותוצריהם, ולהטמיע ולהפיץ את המינוח.
  3. לספק כלים שישמשו לגישה נוחה לכל נתוני המיזם, ולאפשר מתן משמעות פונקציונלית למדע ניסויי באמצעות נתונים אלה, דרך למשל מבחן העשרה.

נומנקלטורת גנים מתמקדת בגנים ובתוצריהם וכלליה ייחודיים לכל יצור, בעוד GO מתמקד באפיון הפונקציונליות שלהם. GO יוצר שפת סימון של כל הנתונים הניתנת לפענוח על ידי מכונות ואחידה לכל היצורים.

GO נמצא בשימוש נרחב במחקרים בתחומי הביולוגיה, ומשמש כלי חשוב בניתוח ניסויים רחבי היקף, בהם נעשה שימוש בשיטות ריצוף מהדור החדש. דבר זה מתבטא בעשרות אלפי הפניות ממאמרים שונים[2]. השימוש העיקרי הוא למבחני העשרה: האם ישנה העשרה לאונטולוגיה מסוימת יותר או פחות מהצפוי בנתוני ביטוי גנים. שימושים נוספים קיימים בתחום הפרוטאומיקה, גנטיקה, מתילציה של ה-DNA ועוד[2].

היסטוריה עריכה

אונטולוגיית הגנים נוסדה בשנת 1998 על ידי תאגיד שנוצר משיתוף פעולה בין מאגרי מידע שעסקו בשלושה יצורי מודל: תסיסנית המחקר, עכבר מצוי ושמר האפייה[1]. במהלך השנים חברו למיזם מאגרי מידע העוסקים ביצורי מודל נוספים, כאשר הם מוסיפים לא רק נתוני אנוטציות, אלא גם תרמו לפיתוח האנוטציות ולכלי הצפייה והניתוח. כיום (2021) מיוצגים 5,086 יצורים במאגר, ול-202 מהם מעל 1,000 אנוטציות[3]. GO מתוחזק באופן אקטיבי, והוספות, תיקונים ושינויים מוצעים על ידי אנשי המיזם[4], חוקרים והציבור הרחב. ההצעות נבדקות על ידי עורכי האונטולוגיה ומיושמות במידת הצורך.

מונחים ואונטולוגיה עריכה

מבחינה מעשית, אונטולוגיה היא ייצוג של משהו שאנחנו יודעים עליו. אונתולוגיות מורכבות מייצוגים של דברים שניתנים לזיהוי או שניתן לצפות בהם ישירות, והקשר בין אותם הדברים. לא קיימת טרמינולוגיה תקנית בביולוגיה או בתחומים דומים, והמונחים יכולים להיות ייחודיים למין, תחום מחקר או לקבוצת חוקרים מסוימת. דבר זה הופך את התקשורת ושיתוף הנתונים לקשה יותר. מיזם ה-GO מעניק אונטולוגיה של מונחים מוגדרים המתארים גנים ותוצריהם. האונטולוגיה מחולקת לשלושה תחומים[5]:

  1. מרכיב תאי (cellular component) - כל החלקים המרכיבים את התא או את הסביבה החוץ תאית;
  2. פעילות מולקולרית (molecular function) - הפעילות של תוצר הגן ברמה המולוקולרית, למשל זרחון או קישור ל-DNA;
  3. תהליך ביולוגי (biological process) - פעולות או סדרות של אירועים מולקולריים עם התחלה וסוף מוגדרים, הרלוונטיים לתפקוד יחידות חיים משולבות: תאים, רקמות, איברים ואורגניזמים.

לכל מונח GO באונטולוגיה יש שם המורכב ממילה או מחרוזת מילים; מזהה ייחודי המורכב מאותיות וממספרים; הגדרה עם מקורות ביבליוגרפיים; ואונטולוגיה המשייכת אותו לאחד משלושת התחומים (מרכיב תאי, פעילות מולקולרית או תהליך ביולוגי). למונח עשויים להיות גם מילים נרדפות, שיכולות להיות מסווגות כזהות במשמעות, כרחבות או צרות יותר או כבעלות משמעות קרובה. ישנן הפניות של המונחים למושגים מקבילים במאגרי מידע אחרים, והערות על משמעות או על שימוש במונח. המינוח מסודר בצורה שאיננה מחזורית באופן מכוון, ולכל מונח יש קשרים מוגדרים עם מונחים אחרים באונטולוגיה[6]. אוצר המילים ב-GO נועד להיות א-תלותי ביצור, ולכן כולל מונחים המתאימים לפרוקריוטים ולאיקריוטים, לחד תאיים ולרב תאיים.

האונטולוגיה וקובצי המינוח זמינים באתר המיזם במספר פורמטים, וניתן לגשת למידע דרך הכלי האינטרנטי AmiGO. ניתן להוריד גם מיפוי של מונחי GO ומקבילהם במערכות מינוח אחרות.

נכון לשנת 2021, קיימים במיזם 43,917 מינוחים[3].

דוגמה למינוח עריכה

id: GO:0000016
name: lactase activity
ontology: molecular_function
def: "Catalysis of the reaction: lactose + H2O=D-glucose + D-galactose." [EC:3.2.1.108]
synonym: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
synonym: "lactose galactohydrolase activity" EXACT [EC:3.2.1.108]
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Reactome:20536
is_a: GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds

אנוטציה עריכה

אנוטציית גנום הוא התהליך שבו נאסף המידע על תוצר גן, ובאנוטציית GO נעשה שימוש במונחי GO בכדי לבצע אנוטציה לגנום. האנוטציות מוטמעות ומופצות באתר GO, שבו ניתן להורידן או לצפות בהם דרך הכלי AmiGO. לכל תוצר גן יש בהכרח מזהה ייחודי, מינוח GO ומקור שעליו הסתמכו (לדוגמה, מאמר מדעי), קוד הוכחה שמציין את סוג הראייה שעליו הסתמכה האנוטציה, התאריך והאדם שביצע את האנוטציה. נוסף לאלו ניתן למצוא לעיתים מידע תומך, כמו התנאים בהם נצפתה הפעילות.

קוד ההוכחה נלקח מתוך אוצר המילים של המיזם, המכיל הוכחות ידניות ואוטומטיות. לדוגמה, TAS (Traceable Author Statement) משמעו שהאדם שביצע את האנוטציה קרא מאמר מדעי מפורסם (וניתן למצוא בעמוד המינוח הפנייה למאמר), ISS (Inferred from Sequence Similarity) משמעו שאדם בחן פלט של בדיקת דמיון רצפי ואימת כי קיים דמיון בעל משמעות ביולוגית. IEA (Inferred from Electronic Annotation) משמעו אנוטציה שבוצעה בתהליך אוטומטי (לדוגמה, תרגום מונחים מכלי אונטולוגיה אחרים). בשנת 2010 מעל 98% מהאנוטציות נבעו משיטות חישוביות, וב-2019 מספר זה צנח לכדי 30%. מכיוון שאנוטציות אלו אינן נבחנות בידי אדם, הם נחשבים על ידי המיזם כפחות אמינים, ולרוב גם אינם מפורטים. בכדי לסייע בתהליך האנוטצייה, המיזם מבצע סדנאות ומדריך אנשים נוספים לסייע בתהליך. בנוסף, אלגוריתמים של למידת מכונה פותחו ושולבו בתהליך.

נכון לשנת 2021, קיימים במיזם 7,908,271 אנוטציות[3]. כ-165,000 מאמרים מדעיים עברו אנוטציה והוכנסו לבסיס הנתונים[3].

דוגמה לאנוטציה עריכה

Gene product: Actin, alpha cardiac muscle 1, UniProtKB:P68032
GO term: heart contraction ; GO:0060047 (biological process)
Evidence code: Inferred from Mutant Phenotype (IMP)
Reference: PMID 17611253
Assigned by: UniProtKB, June 6, 2008

כלים עריכה

ישנם כלים רבים שפותחו המשתמשים במידע שנוצר על ידי המיזם, חלקם מבוססי רשת וחלקם דורשים התקנה מקומית. רובם המוחלט של הכלים הללו נוצרו על ידי צד שלישי; מיזם GO מפתח ותומך בשני כלים: AmiGO ו-OBO-Edit. שני הכלים ניתנים לשימוש ברשת או לוקלית, והם בקוד פתוח.

AmiGO הוא כלי המאפשר למשתמשים לבצע שאילתות, לעיין ולייצג בצורה גרפית אונתלוגיות ומינוחים של תוצרי גנים. יש לו גם כלי BLAST המאפשר לנתח מערכי נתונים גדולים, וכן ממשק לחיפוש ישיר במאגר GO.

OBO-Edit הוא כלי גרפי מבוסס Java (קוד פתוח) שנועד להציג ולערוך את המידע. ניתן לצפות, לחפש ולערוך כל אונטולוגיה באמצעותו.

GOrilla[7] (Gene Ontology enRIchment anaLysis and visuaLizAtion tool) הוא דוגמה לכלי שפותח על ידי צד שלישי. הוא פותח על ידי חוקרים מהטכניון, וניתן לבצע בו מבחני העשרה לשמונה יצורים שונים. דוגמה נוספת לכלי כזה הוא AgriGO[8], המתאים לביצוע מבחני העשרה בצמחים.

Cytoscape[9] הוא דוגמה לכלי מבוסס קוד פתוח שבאמצעתו ניתן לעשות ויזואלוזציה לתוצאות GO.

ראו גם עריכה

לקריאה נוספת עריכה

  • Dessimoz, Christophe; Škunca, Nives, eds. (2017). The Gene Ontology Handbook. Methods in Molecular Biology. Vol. 1446. doi:10.1007/978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.

קישורים חיצוניים עריכה

הערות שוליים עריכה