גוגל תרגום

תרגום-מכונה סטטיסטי של חברת גוגל

גוגל תרגוםאנגלית: Google Translate) הוא שירות חינמי של תרגום מכונה סטטיסטי שפותח על ידי גוגל, המאפשר לתרגם מילים, קטעי טקסט או דפי אינטרנט בין 130 שפות.

גוגל תרגום
סוג תרגום מכונה
תקופת הפעילות 28 באפריל 2008 – הווה (15 שנים) עריכת הנתון בוויקינתונים
מייסדים חברת גוגל עריכת הנתון בוויקינתונים
בעלות גוגל
translate.google.co.il
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

ייסוד עריכה

בשנת 2001 החלה גוגל לספק אפשרות תרגום מאנגלית לשמונה שפות ומשפות אלה לאנגלית, באמצעות שירות שהתבסס על תרגום מכונה סטנדרטי.[1] לאחר שאיכות התרגום לא השתפרה עם השנים הצטרף בשנת 2003 לצוות השירות מדען המחשב הגרמני פרנץ יוזף אוך (Och), שזכה באותה שנה במקום הראשון בתחרות DARPA לתרגום מכונה אוטומטי מהיר. מאז 2004 עומד אוך בראש מחלקת התרגום האוטומטי של גוגל,[2] והאלגוריתמים של השירות מבוססים על מחקריו. תחילה סבלה המערכת הניסויית שפיתח מאיטיות רבה, ותרגום של 1,000 משפטים ארך 40 שעות ונעשה על 1,000 מכונות, אך לאחר כשנה הצליחה המערכת לתרגם משפט בתוך פחות משנייה. בתחילת שנת 2006 הושק השירות המחודש, שאפשר בשלב ראשון לתרגם לסינית וערבית בלבד.

טכנולוגיה עריכה

מערכת "גוגל תרגום" פועלת בטכנולוגיית תרגום מכונה סטטיסטי. כאשר נשלחת בקשת תרגום, המערכת סורקת מיליוני תרגומים אפשריים, ובוחרת מהם את התרגום הסביר ביותר מבחינה סטטיסטית. זאת בניגוד לגישה המסורתית בחקר התרגום והשפה, של ניתוח על בסיס חוקים לשוניים. עם זאת, עבור רוב השפות בשירות, עד לאוקטובר 2007 לא השתמשה גוגל באלגוריתם שפיתחה, אלא בטכנולוגיית התרגום של חברת "סיסטראן" (Systran), שבה עשו שימוש גם שירותי תרגום אחרים כגון דג בבל ,AOL ו-Yahoo.[3]

המודלים הסטטיסטיים לכל שפה בשירות מתבססים על נתונים ממאגר טקסטים דו-לשוניים של מעל מיליון מילים, ומשני מאגרים חד לשוניים המכילים מיליארדי מילים כל אחד.[4] בשלבים הראשונים של השקת השירות אספה גוגל את מאגרי הטקסט ממכוני מחקר לשפות ומהאו"ם, שמסמכיה מתורגמים ל-6 שפות. היותן של השפות ערבית וסינית שפות רשמיות של האו"ם, מהווה כנראה אחת הסיבות לכך שגוגל מיקדה תחילה את מאמציה בשפות אלה, ולא, לדוגמה, בשפה היפנית או הגרמנית, שאינן שפות רשמיות. לאחר מכן החלה גוגל להתבסס גם על טקסטים מהאינטרנט, על מסמכי האיחוד האירופי המתורגמים ל-23 שפות, וכן על גוגל ספרים, אם כי באופן חלקי בלבד בשל בעיות באיכות ה-OCR בספרים הסרוקים.

כמו כלי תרגום אוטומטי אחרים, "גוגל תרגום" מוגבל ביכולותיו. על אף שהוא מסייע לקורא להבין את הקשר התוכן הכללי של טקסט בשפה זרה, הוא אינו מספק תמיד תרגום מדויק, ולעיתים קרובות מופיעות מילים חסרות הקשר או מילים שלא חלים עליהם כללי דקדוק. הדבר נובע בעיקר מהקושי לתרגם אוטומטית מילים בעלות כמה משמעויות ומבני משפטים המשתנים בין שפות. בחלק מהשפות השירות מציג תוצאות טובות יותר.[5]

ככל ששירות "גוגל תרגום" אוסף יותר תרגומים ביותר שפות, כך, באופן תאורטי, פוחתים הסיכויים לתרגומים שגויים בתרגום מכונה סטטיסטי. עם זאת, חוקר התרגום ועובד במחלקת התרגום של גוגל אנדראס זולמן טען כי על גוגל לחזור לניתוח מבוסס כללים, מאחר ש"כל הכפלה של כמות הנתונים הוביל לשיפור של 0.5% באיכות הפלט, ואילו אפשרויות ההכפלות אינן אינסופיות - אנו נמצאים כעת על סף שמעבר לו אין יותר טקסטים בעולם שאנחנו יכולים להשתמש בו". במאי 2012 הודה מנהל המוצר בגוגל, ג'ף צ'ין, כי "ייתכן כי לא נוכל להגיע לשלמות עד אשר ימציאו אינטליגנציה מלאכותית מלאה".[6]

מאז סוף 2016, מבוסס התרגום האוטומטי של גוגל תרגום על למידה עמוקה.[7]

היסטוריה עריכה

באוגוסט 2008 השיק השירות יישום ווב מבוסס HTML5 עבור משתמשי אייפון, ובפברואר 2011 יצא היישום הרשמי ב-Appstore. היישום מאפשר לקבל קלט שמע באמצעות זיהוי קול ב־15 שפות ולתרגם ליותר מ-50 שפות, וכן להשמיע את התרגום ברוב השפות. היישום המקביל לאנדרואיד, שגרסתו הראשונה יצאה בינואר 2010, כולל תכונה של "מצב שיחה" המאפשרת למשתמשים לנהל שיחות קוליות מתורגמות עם דוברי שפות זרות ביותר מ-15 שפות.[8]

ב-9 ביוני 2009 הושק כלי התרגום של גוגל למתרגמים מקצועיים (Google translate Toolkit), הכולל ממשק משתמש WYSIWYG, מונחונים, ושיתוף תרגומים. באותה שנה אפשרה גוגל לבעלי אתרים להוסיף לאתריהם את כלי התרגום האוטומטי Website Translator, המתרגם את האתר בשלמותו.

במאי 2011 הודיעה גוגל כי תפסיק להפעיל את ה־API של השירות בשל נטל כלכלי משמעותי, אך לאחר לחץ ציבורי חזרה בה והודיעה כי תוציא גרסה בתשלום.[9][10]

בספטמבר 2019, הודיעה גוגל כי ב-4 בדצמבר אותה שנה היא תפסיק להפעיל את Google translate Toolkit. זאת, לפי ההודעה, לאור התמעטות המשתמשים בו בשעה שקיימים בשוק די כלים חלופיים.

אפשרויות עריכה

השירות מאפשר לתעתק אותיות הנכתבות באלפבית לטיני לאותיות המקבילות בכ-23 שפות, ובכללן יוונית, דוואנגרית, קירילית, ערבית ועברית. ב-2012 נוספו לשירות מקלדות וירטואליות עם תווים ביפנית, בוייטנאמית ובעברית.

גוגל הטמיעה את תכונת התרגום במגוון שירותיה: בתוצאות החיפוש, בסרטונים ביוטיוב המכילים רצועת כתוביות, בדפדפן גוגל כרום, ב-Google Docs ,Google Groups, וכן בשירות הדואר מבוסס רשת שלה Gmail.

למרות המחסור במאגרי טקסטים מקוונים ביידיש, השירות מאפשר תרגום לשפה זו הודות לדמיונה הרב לגרמנית, וכן בשל המילים הרבות שהיא שואלת מעברית ופולנית.[11]

מטרות והשפעה עריכה

נכון לשנת 2012 פונים לשירות כ-200 מיליון משתמשים מדי חודש, למעלה מ-92 אחוז מהם מגיעים מחוץ לארצות הברית. לפי ההערכה, השירות מתרגם ביום אחד את אותה כמות טקסט שמייצרים המתרגמים המקצועיים בעולם בשנה.[דרוש מקור]

לפי אנשי השירות בגוגל, השאיפה העומדת מאחוריו היא שבירת מחסום השפה, על מנת לאפשר לכל אדם גישה לכלל המידע בעולם ועל מנת לקבל "עצמאות" מהשפה. עם זאת, ישנם המאמינים כי באופן אירוני, שירות התרגום האוטומטי של גוגל למעשה מגביר את התלות בשפה בכך שהוא גורם לעצלנות לרכישת שפות חדשות. על פי דאגלס הופשטטר, אחד המבקרים הנוקבים ביותר של הפרסום המופרז סביב השירות, היכולת להתקיים בתוך שפה ולעבור בין שפות, להבין את ההברה ואת ההדהוד התרבותי, את הבדיחות, חידודי הלשון ואת הניב, הם הדברים שהופכים את בני האדם לאנושיים ולאינדיבידואלים יותר מכל. הופשטטר טוען כי "כולנו ניכנע כנראה ללחצים להשתמש בשירות ברמה מסוימת, אך זה לעולם לא יקבל את התחושה של משפטים מנוסחים".[12]

ציוני דרך עריכה

2001 עריכה

השירות הוקם. ניתן לתרגם מאנגלית ובחזרה לשפות הבאות:

2006 עריכה

שפות חדשות:

2007 עריכה

שפות חדשות:

2008 עריכה

נוספה אפשרות לבצע תרגום בין כל זוג שפות, בתיווך השפה האנגלית.

שפות חדשות:

2009 עריכה

סיום שלב הבטא.

הוספת אפשרות תעתיק באותיות לטיניות עבור השפות סינית, יפנית, קוריאנית, רוסית, אוקראינית, בלארוסית, בולגרית, יוונית, הינדית ותאילנדית, עבור תרגומים מערבית, פרסית והינדית, המשתמש יכול להזין תעתיק לטיני של הטקסט, שיתורגם לתעתיק בשפות אלה.

הוספת אפשרות הקראת טקסט באנגלית, איטלקית, צרפתית וגרמנית.

שפות חדשות:

2010 עריכה

נוספה אפשרות הקראת טקסט באפריקנס, אלבנית, קטלאנית, סינית, קרואטית, צ'כית, דנית, הולנדית, פינית, יוונית, הונגרית, איסלנדית, אינדונזית, לטבית, מקדונית, נורווגית, פולנית, פורטוגזית, רומנית, רוסית, סרבית, סלובקית, סוואהילית, שוודית, טורקית, וולשית וייטנאמית, ערבית, יפנית וקוריאנית. נוספה תמיכה בתעתיק לטיני עבור ערבית (הוסרה מהשירות בסוף 2010) ואפשרות הקלדה פונטית בערבית, יוונית, הינדית, פרסית, רוסית, סרבית ואורדו. כמו כן נוספה בדיקת איות.

שפות חדשות:

2011 עריכה

בלחיצה על מילה מתורגמת, מוצע למשתמש תרגומים חלופיים מהם ניתן לבחור.

שפות חדשות:

2012 עריכה

  • שמע חדש לשפות אנגלית, צרפתית, ספרדית, גרמנית ואיטלקית.

שפות חדשות:

2013 עריכה

נוסף מילון שימור אותיות.

שפות חדשות:

2014 עריכה

שפות חדשות:

2016 עריכה

שפות חדשות:

2020 עריכה

שפות חדשות:

2022 עריכה

נוספה אפשרות הקראת טקסט בעברית, אלבנית, בוסנית וסווהילית.

שפות חדשות:

שפות בפיתוח עריכה

נכון למרץ 2023

קישורים חיצוניים עריכה

  מדיה וקבצים בנושא גוגל תרגום בוויקישיתוף

הערות שוליים עריכה

  1. ^ Breaking down the language barrier—six years in, בבלוג השירות
  2. ^ Franz Josef Och - Research at Google
  3. ^ באתר גוגל סיסטם
  4. ^ וועידה בנושא תרגום מכונה, פוקט, תאילנד
  5. ^ השוואה בין שירותי תרגום מקוון, באתר tcworld
  6. ^ Now you can polish up Google’s translation of your website, בבלוג השירות
  7. ^ Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation
  8. ^ Start the conversation with Google Translate for Android, בבלוג השירות
  9. ^ Feldman, Adam (3 ביוני 2011). "Spring cleaning for some of our APIs". Google Code. נבדק ב-3 ביוני 2011. {{cite web}}: (עזרה)
  10. ^ "Google cancels plan to shutdown Translate API. To start charging for translations". 4 ביוני 2011. נבדק ב-4 ביוני 2011. {{cite web}}: (עזרה)
  11. ^ באתר לוס אנג'לס טיימס (באנגלית)
  12. ^ באתר הגרדיאן (באנגלית)