ISO 10646 – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ הוספת קטגוריה וקישור לשפה
מ הגהה ותיקון של מונח
שורה 1:
תקן '''ISO 10646''' של ארגון התקנים העולמי [[ISO]] הוא תקן למפת תווים אוניברסלית (UCS, ראשי תיבות של Universal Character Set) שנועד לאחד את כל מפות התווים בשימוש קיים ולקודד את כל הכתבים הנוכחיים וההיסטוריים של האונושותהאנושות. כיום תקן זה מאוחד עם תקן אחר למפת תווים אוניברסלית בשם [[יוניקוד]]. הוא עדיין נבדל ממנו בכמה תכונות, אך אין הוא שונה ממנו בפרטים כפי שהיה בעבר.
 
==היסטוריה==
שורה 7:
את תווי תקן ISO 10646 הראשוני הזה ניתן היה לקודד בשלוש צורות: UCS-4, ארבעה בתים לכל תו, המאפשרת לקודד את כל התווים; UCS-2, שני בתים לכל תו, המאפשרת לקודד רק את המשטח הראשון, 32, המשטח הרב־לשוני הבסיסי, המכיל את 65,536 התווים הראשונים; ו־UTF-1, שבו מקודדים את כל התווים בקבוצות של בתים בעלות אורך משתנה (אחד עד חמישה בתים, שכולם מכילים תווים שאינם תווי בקרה - ראו לעיל).
 
הנה כי כן ב־1990 היו שתי יוזמות למפת תווים אוניברסלית: יוניקוד, בת 16 הסיביות לכל תו (65,536 תווים אפשריים) ו־ISO 10646. חברות התוכנה לא היו מוכנות לסבול את הסיבוכיות ואת המגבלות של תקן ISO והצביעו נגד התקן בהצבעה הכללית של מוסדות התקינה. אנשי ISO הבינו כי לא יוכלו להמשיך לתמוך בתקן בצורתו הנוכחית ונדברו עלעם אנשי יוניקוד על איחוד התקנים. הוחלט על שני שינויים: ההגבלה על התווים (האיסור על תווי הבקרה) תוסר, כך שתו בעל ערך כמו 0x101F0x0000101F (המכיל, לפי ערכי הבתים שלו, שניארבעה תווי בקרה בזה אחר זה) יהיה מותר לשימוש; והאוצר של המשטח הרב־לשוני הבסיסי של ISO 10646 יהיה זהה לזה של תקן יוניקוד.
 
בינתיים, עם חלוף השנים, השתנו הדברים ביוניקוד עצמו: 65,536 לא נראו עוד כמספיקים, והתקן מגרסה 2 ואילך תומך בקידוד 1,112,064 תווים באמצעות מנגנון [[UTF-16]]. לשם כך הוגבל ISO 10646 להכיל עד כמה תווים שאפשר לקודד באמצעות UTF-16 ולא יותר, כלומר מיליון וקצת תווים במקום שני מיליארד. קידוד UCS-4 של ISO 10646 הוכנס לתקן יוניקוד בהגבלה לתחום של UTF-16 ושמו שונה ל־[[UTF-32]]. באשר ל־UTF-1, איש לא השתמש בו, בשל עיצובו הגרוע (אין אפשרות להבחין בתים בודדים ומתחילים ומסיימים של קבוצות - בעייה דומה לזו של הקידוד היפני [[Shift-JIS]]) וביצועיו הנמוכים (הרבה פעולות חלוקה). רוב פייק וקן תומפסון, המתכננים של מערכת ההפעלה Plan 9, המציאו קידוד חדש ומהיר ומעוצב היטב לקידוד תווים באורך משתנה, וזה היה ל־[[UTF-8]] המוכר לנו כיום.