UTF-16 – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ הוספת קישור לתאימות לאחור
←‏תיאור הקידוד: סבור שיש לרמוז יותר לקורא מה הקשר בין 2,048 ל 1,048,576
תגית: חזרות
שורה 10:
== תיאור הקידוד ==
 
UTF-16 פועל כך: ב־2,048 = 1,024 + 1,024 תווים מתוך ה־65,536 הראשונים משתמשים למיעון 1024×1024, כלומר 1,048,576, תווים נוספים. הקודים האלה הם U+D800 עד U+DBFF לחצי הראשון ו־U+DC00 עד U+DFFF לחצי השני. צירוף של קוד מהחצי הראשון ולאחריו קוד מהחצי השני משמש למיעון תו יוניקוד מעבר ל־U+FFFF, כלומר מ־U+10000 עד U+10FFFF. למשל, הצירוף D84C DFB4 ממען את התו U+233B4 (שהוא סימן סיני נדיר). מנגנון זה נקרא מנגנון '''ממלאי המקום''' או באנגלית surrogates.
 
תחת קידוד זה, יוניקוד מגרסה 2 ואילך יכול להכיל 1,112,064 תווים, די והותר לכל שימוש עתידי.