טטואבה (Tatoeba; ביפנית: たとえば – "לדוגמה") הוא פרויקט של שיתוף פעולה בינלאומי שמטרתו לאסוף ולרכז מספר רב של משפטים, המתורגמים ממספר רב של שפות למגוון שפות אחרות.

טטואבה
סוג אתר אינטרנט עריכת הנתון בוויקינתונים
תקופת הפעילות 2006–הווה (כ־18 שנים) עריכת הנתון בוויקינתונים
tatoeba.org
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

שם הפרויקט הוא המילה היפנית שפירושה "לדוגמה", כלומר, דוגמה לשימושי לשון שונים במילים ובביטויים. בסיס הנתונים של טטואבה מכיל מספר רב של משפטים לדוגמה, שתורגמו ועדיין מתורגמים למכלול רחב של שפות. מכלול התרגומים משמש מעין מילון תרגום רב-לשוני; כאשר מחפשים בו תרגום למילה כלשהי, האתר מציג משפטים לדוגמה שבהם משולבת המילה המבוקשת. האתר ממשיך להתעדכן ולהתרחב מדי יום, כאשר הגולשים באתר ממשיכים להעלות משפטים משלהם, בשפת האם שלהם או בשפות אחרות, או לתרגם משפטים קיימים לשפתם או לשפות אחרות.

הרכב עריכה

אוסף הטקסטים של טטואבה מבוסס על קורפוס "טאנאקה" (אוסף גדול של משפטים מקבילים ביפנית ובאנגלית), שנוספו אליו שפות רבות אחרות החל משנת 2006, תחת ניהולה של טראנג הו (Trang Ho).

 
תצוגה גרפית: כל צומת מייצג משפט; כל חץ מצביע על קישור בין שני משפטים; כאשר שני משפטים מחוברים, יש להם אותה משמעות.

אתר הפרויקט עריכה

אתר פרויקט טטואבה מכיל מגוון כלים ואמצעים המאפשרים חיפוש ועריכה של המשפטים. בפרויקט משתתפת קהילה רחבה של תורמים דוברי שפות רבות, העוסקים בהזנה, בתרגום ובעריכה של המשפטים בשפות השונות, ואף בהגהה ובתיקון של משפטים קיימים, כל אחד בשפתו הוא.

נכון לסוף אוקטובר 2015, טטואבה כוללת כ-4,389,000 משפטים ב-221 שפות. שבע השפות המכילות את המספר הרב ביותר של משפטים בפרויקט נכון לנקודת הזמן האמורה הן אנגלית, אספרנטו, איטלקית, טורקית, רוסית, גרמנית, וצרפתית.

קישורים חיצוניים עריכה

  מדיה וקבצים בנושא טטואבה בוויקישיתוף