זיהוי תווים אופטי – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
טויטה (שיחה | תרומות)
תגיות: שוחזרה עריכה ממכשיר נייד עריכה דרך האתר הנייד
ביטול גרסה 34195961 של טויטה (שיחה)
שורה 9:
* '''התאמה תבניתית''' – בשיטה זו שומרים על תבניות שונות של האותיות, ומנסים לבדוק איזו מהאותיות היא הדומה ביותר לתבנית.
* '''תיאור מבני''' – בשיטה זו מחלקים את האות לחלקים שונים ויוצרים תיאור של חלקיה השונים של האות והיחסים שביניהם.
*שימוש ב[[למידת מכונה]] או [[רשת עצבית מלאכותית]] – החל מ־2016 לערך, פתרונות ה־OCR המובילים בעולם נשענים על רשתות נוירונים מלאכותיות או [[למידה עמוקה]]. בגישה זו המכונה לומדת לזהות את התווים על ידי "לימוד" על בסיס התבוננות במיליוני תווים. יתרונה הגדול של השיטה היאהוא ביכולת להתאים אותה לכל שפה ולכל "סגנון כתב", כולל כתב יד. הביצועים של מערכות OCR הפועלות בגישה זו עולים על כל דרך פתרון מסורתית.
 
כדי למזער את כמות התווים השגויים שנוצרים בתהליך, מפעילה התוכנה לפעמים בדיקה מול מילון. במקרה זה התוכנה מכילה רובד נוסף שמרכיב את התווים המזוהים למילים שלמות, מחפש כל מילה במילון, ובמקרה שאינו מוצא אותה, מנסה לשנות תווים מסוימים (אלה שבהם ודאות הזיהוי נמוכה) עד שהמילה המזוהה נמצאת באוצר המילים של המילון.