גרירה טקסטואלית

גרירה טקסטואלית (Textual Entailment - TE) היא יחס מכוון בין טקסטים, המבטא את העובדה שהנכונות של טקסט אחד גוררת את הנכונות של טקסט אחר. אחת הבעיות האופייניות לתחום של עיבוד שפה טבעית בעזרת מחשב היא הבעיה של זיהוי גרירה טקסטואלית (RTE): בהינתן טקסט (t) והיפותזה (h), על המחשב להחליט האם הטקסט גורר את ההיפותזה, כלומר, האם אדם סביר הקורא את הטקסט יגיע למסקנה שההיפותזה נכונה.

לדוגמה, נתבונן בטקסטים הבאים:

  • טקסט: "תרח הוליד את אברם את נחור ואת הרן, והרן הוליד את לוט"
  • היפותזה א: "לוט הוא נכד של תרח"
  • היפותזה ב: "תרח הוא גבר"
  • היפותזה ג: "תרח הוא בן 70"
  • היפותזה ד: "תרח הוא עקר מלידה"

הטקסט גורר את היפותזה א ואת היפותיזה ב; הטקסט לא גורר את היפותזה ג; והטקסט סותר את היפותזה ד.

תוכנת מחשב שמטרתה לזהות גרירה טקסטואלית צריכה להיות בעלת ידע במגוון רחב של תחומים, החל בתחום המילולי, דרך התחום התחבירי, ועד לתחום הסמנטיקה וידע על העולם.

זיהוי גרירה טקסטואלית יכול לשמש כשלב ביניים במספר רב של אפליקציות הקשורות לעיבוד שפה טבעית, כגון: חיפוש תשובות לשאלות בטקסט גדול, הפקת מידע מתוך טקסט לפי תבנית, סיכום מסמכים אוטומטי, ועוד.

קישורים חיצונייםעריכה

  ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.