זיהוי תווים אופטי – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Matanyabot (שיחה | תרומות)
מ הסרת קישורים עודפים
שורה 7:
==שיטות של זיהוי תווים אופטי==
את הזיהוי ניתן לבצע בשתי צורות שונות:
 
* '''התאמה תבניתית''' - בשיטה זו שומרים על תבניות שונות של האותיות, ומנסים לבדוק איזו מהאותיות היא הדומה ביותר לתבנית.
* '''תיאור מבני''' - בשיטה זו מחלקים את האות לחלקים שונים ויוצרים תיאור של חלקיה השונים של האות והיחסים שביניהם.
שורה 16 ⟵ 15:
[[קובץ:PlainPaperOMRFormSm.jpg|שמאל|ממוזער|200px|טופס לסקרים באמצעות OCR]]
שימוש בטכנולוגיה של זיהוי תווים אופטי, והמרת קובץ גרפי טקסטואלי לקובץ המורכב מתווים, נעשים בדרך כלל לשם המטרות הבאות:
 
* עיבוד מחדש וסידור של התמליל, שילובו בתמליל מודפס עתידי, או הדפסתו מחדש בעיצוב אחר
* אחסון נתונים טקסטואליים במחשב, תוך הנגשת האפשרות של חיפוש תוכנם לחיפוש, למשל בתוכנת החיפוש הפנימית או במנועי חיפוש כדוגמת גוגל
שורה 47 ⟵ 45:
בזיהוי כתב יד אי אפשר להשתמש ב[[אלגוריתם]] המשווה את מאפייני האות ל[[גופן]]. לכן משתמשים בשיטות זיהוי אחרות (עיין [[זיהוי כתב]]
בוויקיפדיה). אחת מהשיטות (כנראה בן הקלות ביותר ל[[תכנות]] ולהבנה, מושפעת מרעיונות של [http://videolectures.net/mlss09uk_bishop_ibi/ כריסטופר בישופ] ) היא יצירת תמונה בצורת [[מלבן]] (בשחור לבן) של מופעים שונים של אותה אות כתב, לדוגמה : כל שורה מכילה 10 מופעים שונים (תמונות) של אותה אות, וכל שורה מתאימה לאות שונה. כל מופע של אות חסום במלבן (או ב[[מעגל חוסם|מעגל]]),ומתוח לגובה ולרוחב כך שהוא יתאים בדיוק לגודל מלבן המופע. כל המלבנים בשורה גודלם קבוע, והם נמצאים במקום קבוע בתמונה. צבע מופע האות במלבן: שחור, צבע המלבן: לבן, וצבע הרקע: שחור. כדי למצוא מה מאפיין כל אות, ה[[תוכנה]] מחשבת בזמן הלימוד (השלב האיטי), כמה פעמים נחתכת האות על ידי קו ישר העובר בין שתי נקודות על מלבן החוסם את האות. התוכנה בונה [[קובץ]] של מספרים שלמים, המכיל את התכונות הטובות ביותר להבדלה בין אות אחת לשנייה. לדוגמה: תכונה מספר 1234 הוא קו החותך את כל מופעי האות שמספרה 15, 3 פעמים, ואת מופעי האות שמספרה 7, 0 פעמים. בזמן הזיהוי (השלב המהיר) התוכנה יוצרת מלבן חוסם סביב תמונת אות המיועדת לזיהוי, קוראת את קובץ התכונות הטובות ביותר, טוענת את תוכנו ב[[מערך (מבנה נתונים)|מערך]], ובודקת כמה פעמים נחתכת האות על ידי הקווים המגדירים את התכונות הטובות ביותר, ולפי הנתונים הללו בודקת לאיזו אות התמונה הזאת מתאימה ביותר.
[[קובץ:Mylet.jpg|ממוזער|My letters|תמונת מופעי האותיות]]
הערות:
*מיקום [[נקודה (גאומטריה)|נקודה]] מוגדר על ידי זוג מספרים: אחד מהם קובע היכן היא נמצאת ביחס לרוחב תמונת המופעים, והשני קובע היכן היא נמצאת ביחס לאורכה.