פתיחת התפריט הראשי

סינתזת דיבור

דוגמה לשימוש בסינתזת דיבור ליצירת קטע אודיו בו מוקרא הערך Festival Speech Synthesis System בוויקיפדיה האנגלית. קטע האודיו הופק באמצעות התוכנה txt2audio

סינתזת דיבוראנגלית: Speech synthesis) היא טכניקה להפקה מלאכותית של דיבור אנושי. מערכות סינתזת דיבור נקראות לעיתים רבות מערכות טקסט לדיבור (text-to-speech או TTS) בשל יכולתן להמיר טקסט לדיבור.

סינתזה של דיבור נעשית באמצעות שיבוץ של רכיבי דיבור המקודדים למילים ולמשפטים של ממש[1]. לרוב סינתזת דיבור מופקת על בסיס הקלטות שונות שבוצעו בעבר של מקטעים ווקאלים שונים. עם זאת, קול אנושי אשר הומר בקודים ספרתיים מצריך מקום רב לאחסון ונשמע מלאכותי וחסר-גוון[1].

בסינתזה של הדיבור המילים מורכבות מפונמות[1]. דבר זה מאפשר למשפט הסינתטי לכלול גם הטיות קול והדגשות, בתנאי שהמחשב יכול לנתח את ההדגשים שבמסר בשעת הרכבתו[1].

האיכות של תוצר מערכות סינתזת דיבור נמדד לרוב על סמך הדמיון לדיבור אנושי אמיתי, וכמו כן מסתמך גם על עד כמה התוצר הסופי מובן. תוכנות סינתזת דיבור ברמות גבוהות יכולות למלא תפקיד חשוב, למשל על ידי מתן אפשרות לאנשים לקויי ראייה או בעלי דיסלקסיה להאזין למסמכים שנכתבו במחשב. מאז שנות ה-90 של המאה ה-20 מכילות מערכות הפעלה רבות מכילות יישומי סינתזת דיבור.

קישורים חיצונייםעריכה

  מדיה וקבצים בנושא סינתזת דיבור בוויקישיתוף

הערות שולייםעריכה

  1. ^ 1.0 1.1 1.2 1.3 פרידמן, א. (1984). לכסיקון המחשב. תל אביב: ספריית אנשים ומחשבים.
  ערך זה הוא קצרמר בנושא טכנולוגיה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.