MPEG-2 – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
התייחסות ל-System. הוספת פרוט ושיפורים בניסוח.
שכתוב מקיף והרחבה
שורה 1:
{{שכתוב|יש להסביר מה התקן עושה ואיך, רק אז לפרט|נושא=מחשוב}}
'''MPEG-2''' הוא [[תקן]] פופולרי לדחיסה וקידוד דיגיטאלי של [[וידאו]] ואותות שמע (Audio) שפותח על ידי Moving Picture Experts Group (ראשי התיבות של MPEG). התקן נוצר כשידרוג לMPEG-1 שקדם לו והוא מבוסס עליו. הוא נועד להחליף את ישומי הוידיאו האנלוגי ולכן במרבית הישומים מאפיני התצוגה שלו כמו גודל התמונה ותדר התצוגה יהיו זהים לוידאו האנלוגי ששימשלאלו לתצוגהששימשו [[טלוויזיה|בטלויזיה]] בעלת [[הפרדה סטנדרטית]] (SD).
 
התקן נוצר כשידרוג ל-MPEG-1 שקדם לו והוא מבוסס עליו. הוא בעל [[תאימות לאחור]] ומכיל את כל התכונות של MPEG-1, אך עולה עליו באיכות התמונה והשמע, באיכות הדחיסה, ובגמישותו הרבה.
ל-MPEG-2 יתרונות רבים על פני התקן שקדם לו, בעיקר באיכות התמונה, באיכות הדחיסה, עם אפשרויות דחיסה מודולריות לאיכויות התמונה, השמע ואלמנטים נוספים (כתוביות, רצף ועוד) ובגמישותו הרבה.
 
התקן מבוסס על [[דחיסה מאבדת נתונים]] (lossy) [[קידוד וידאו|לקידוד]] [[דחיסה מאבדת נתונים|ודחיסת]] מדיה המורכבת מ[[וידאו]] ואותות שמע. שיטות אלה מייעלות את האחסון והשידור של סרטים. תקן זה נפוץ כיום ברוב ישומי הטלויזיה בהפרדה סטנדרטית כמו בשידורישידורים הלוויין,דיגיטליים הב[[לוויין תקשורת|לוויין]] וב[[טלוויזיה בכבלים|כבלים]], השידורים הדיגיטליים הקרקעיים, נגני [[DVD]] ועוד. ישומי טלוויזיה בהפרדה גבוהה ([[HDTV]]) מבוססים בדרך כלל על תקן MPEG-4 המתקדם יותר.
 
התקן מחולק לשלושה חלקים עיקריים בהתאם לסוגילסוג המידע בהםבו הוא מטפל: מערכת (system), וידאו ואודיוושמע. חלק המערכת מתאר אפשרויות ל[[פורמט מכל]] עבור המדיה: transport stream אשר מותאם לשידור זורם, כגון שידורי טלוויזיה או רדיו, ו - program stream אשר מותאם לקובץ אשר שמור בשלמותו בהתקן אחסון כלשהו כגון דיסק או DVD. חלק הווידאו מתאר את מבנה הנתונים והאלגוריתמים לדחיסת הווידאו. חלק האודיוהשמע מתאר את מבנה הנתונים והאלגוריתמים לדחיסת אודיושמע. ומכילקיים שניחלק אלגוריתמיםרביעי שונים:שמכיל [[MP3]]הנחיות לבדיקת תאימות עבור מי שמשתמש בתקן ו-AAC.
 
השימוש בקוד MPEG-2 דורש מקודד, אשר הופך את המידע המקורי (תמונה וקול) לרצף של קוד דיגיטאלי שיקרא זרם MPEG, ומפענח אשר קורא את הרצף ומשחזר את המידע המקורי.
 
== המערכת (System) ==
זרם של קוד MPEG מכיל כמה זרמים בסיסיים (Elementary Stream) שונים ונבדלים. במקרה הפשוט יהיו אלה זרם האודיוהשמע וזרם הוידאו אולם יתכנו כמה זרמי אודיו, למשל שפות שונות ב-DVD, ואף כמה זרמי וידיאו כאשר שידור אחד מכיל כמה ערוצים. כל אחד מהזרמים נקצץ [[חבילת מידע|לחבילות]] בסיסיות (Packet) בגודל קבוע והחבילות "נארזות" מחדש, לסרוגין, בלווית תקורה מתאימה (Header) כך שהמפענח יוכל לזהות את מקורן ולבנות מחדש את הרצף. באופןרמת שהמידעהמערכת בכלמכילה אחדגם מהזרמיםנתונים מגיעשאינם בקצבשמע מספיק.או רמתוידאו המערכתכגון מאפשרתכתוביות, לזהותתאריך, ולנהלמידע אתעל סוגיהסרט החבילותועוד. ולתאם ביניהן.
 
בגלל השוני בישומים וצורת השימוש מבחינים בין מערכת שנועדה לשידורים, Transport Stream ובין זו שמיועדת לקבצי איחסון כמו ב-DVD שנקראת Program Stream. קובץ ב-DVD למשל יכול להכיל כמה זרמי שמע לתמיכה בשפות שונות. לעומת זאת, זרם משודר יכיל בדרך כלל כמה ערוצי טלויזיה שונים ואת לוח השידורים. כל אחת מהמערכות משתמשת בחלק מהאפשרויות הרבות שמציע MPEG-2.
 
== זרם הוידאו ==
תצוגת וידאו מורכבת מרצף של תמונות. זרם הוידיאו של MPEG-2 מורכב מרצף של נתונים דחוסים המאפשרים לשחזר ולהציג את התמונות בזו אחר זו. בשידור של זרם וידאו או בקריאה מנגן DVD, חייב קצב התמונות בקוד להתאים לקצב התצוגה, כלומר 25 או 30 תמונות בשנייה, תלוי בשיטת התצוגה, [[PAL]] או [[NTSC]]. כל תמונתתמונה יכולה להופיע כיחידה אחת, תמונת מסגרת (Frame), או כשניכשתי שדותתמונות שדה (Fields) המכיליםעוקבות המכילות לסרוגין את קווי התצוגה האי-זוגיים והזוגיים. שידור ותצוגה בשיטה זו נקראים סריקה שלובה (Interlaced). תקן MPEG-2 תומך בשני סוגי התמונות. במקרה של תמונות שדה, התמונות ישודרו ויוצגו בתדר כפול. התמיכה בתמונות שדה (Field Picture) היא אחד השיפורים בהשוואה ל-MPEG-1.
 
=== דחיסת התמונה ===
המידע המשמעותי מבחינה כמותית בזרם MPEG הוא אות החוזי (התמונה). יש מספרשתי רמות בהן אפשר לדחוסדוחסים את המידע:
 
* '''דחיסה מרחבית''' - כלומר דחיסת המידע שמרחבשבמרחב התמונה. דחיסה זאת נעשית ברמת התמונה הבודדת. כל מסגרת וידיאו היא למעשה תמונה דיגיטלית והיא נדחסת בשיטות המקובלות לדחיסת תמונות, באופן דומה לדחיסת [[JPEG]], תוך ניצול העובדה שהעין האנושית מתעלמת מחלק משמעותי מהמידע שבתמונה (למשל, הרגישות לצבע נמוכה יותר מהרגישות לערכי בהירות). בנוסף מנצלת הדחיסה את העובדה שחלק מהמידע בתמונה חוזר על עצמו (למשל, [[פיקסלים]] סמוכים דומים זה לזה).
 
*'''דחיסה טמפורלית''' (בציר הזמן). דחיסה זו מנצלת את העובדה שבדרך כלל בצילום וידאו יהיו שתי תמונות עוקבות כמעט זהות זו לזו. לפיכך, אם תמונה אחד קודדה במלואה, מספיק לקודד את ההבדלים כדי לקבל את התמונה הבאה.
 
=== סוגי התמונות ב-MPEG-2: ===
קוד ה-MPEG-2 של התמונה מאפשר למפענח לשחזר את התמונה שתוצג. מכיוון שחלק מהתמונות נשמרות במלואן בעוד שרוב התמונות שומרות רק את ההבדלים, קיימים ב-MPEG-2 כמה סוגי תמונות (למרות שתמונה יכולה להיות מסוג מסגרת (Frame) או שדה (Field), המונח הנפוץ הוא Frame והוא מתייחס רק לשיטת הקידוד שלהלן).
 
* I-Frame - מהמילה Intra. הקוד מאפשר לשחזר את התמונה המלאה באופן עצמאי, ללא תלות בתמונה אחרת. (מסומנת באות I).
* P-Frame - מהמילה (Predictive). - "התמונה הבאה".המקודדת, התמונהשתוצג המקודדתרק בהמשך, מכילה את השינוי מתמונת ה-I או ה-P שקדמה לה ומבוססת עליה (מסומנת באות P).
* B-Frame - מהמילה (Bidirectional). מכילה את ההבדל מתמונת I או P שקדמה לה וגם מזאת שבאה אחריה, כלומר השיחזור הוא לשני הכיוונים וזה מקור השם. כמות המידע המקודד בתמונה זו היא הקטנה ביותר. איכות התמונה פחותה ואילו הדחיסה מקסימלית. אינה משמשת כפריים התייחסות. (מסומנת באות B).
 
מכיוון שפיענוח תמונת B מבוסס על תמונת P שתוצג אחריה, יש צורך לפענח את תמונת ה-P לפני תמונת ה-B. על כן, בקוד שבזרם ה-MPEG-2 תופיעחייבת תמונת P להופיע לפני תמונת ה-B שתלויה בה. כלומר, סדר הופעת התמונות בקוד אינו זהה לסדר התצוגה. כדי לפענח תמונת B יש צורך בזיכרון שישמור את שתי התמונות האחרות.
* I-Frame - הקוד מאפשר לשחזר את התמונה המלאה באופן עצמאי, ללא תלות בתמונה אחרת. (מסומנת באות I).
* P-Frame - מהמילה (Predictive) - "התמונה הבאה". התמונה המקודדת מכילה את השינוי מתמונת ה-I או ה-P שקדמה לה ומבוססת עליה (מסומנת באות P).
* B-Frame - מהמילה (Bidirectional). מכילה את ההבדל מתמונת I או P שקדמה לה וגם מזאת שבאה אחריה, כלומר השיחזור הוא לשני הכיוונים וזה מקור השם. כמות המידע המקודד בתמונה היא הקטנה ביותר. איכות התמונה פחותה ואילו הדחיסה מקסימלית. אינה משמשת כפריים התייחסות. (מסומנת באות B).
 
כל רצף תמונות לפיענוח חייב להתחיל בתמונה מסוג I. רצף תמונות נקרא GOP (ראשי תיבות של Group Of Pictures). רצף התמונות הוא לרוב (...IBBPBBP(IBBP אך ניתן להגדיר רצף אחר. ככל שיהיה הרצף ארוך תושג דחיסה רבה יותר, שכן כמות המידע בתמונת I גבוהה בסדרי גודל. מצד שני, כאשר מתחילים בפיענוח זרם וידאו, למשל אחרי החלפת ערוץ בממיר, יש צורך להמתין להופעה של תמונת I כדי להתחיל את פענוח התמונות, שכן יתר התמונות מתבססות עליה. לכן תופיע תמונת I בדרך כלל בכל חצי שנייה.
מכיוון שפיענוח תמונת B מבוסס על תמונת P שתוצג אחריה, יש צורך לפענח את תמונת ה-P לפני תמונת ה-B. על כן, בקוד ה-MPEG-2 תופיע תמונת P לפני תמונת B שתלויה בה. כלומר, סדר הופעת התמונות בקוד אינו זהה לסדר התצוגה. כדי לפענח תמונת B יש צורך בזיכרון שישמור את שתי התמונות האחרות.
 
== זרם השמע (Audio) ==
כל רצף תמונות לפיענוח חייב להתחיל בתמונה מסוג I. רצף תמונות נקרא GOP (ראשי תיבות של Group Of Pictures). רצף התמונות הוא לרוב (...IBBPBBP(IBBP אך ניתן להגדיר רצף אחר. ככל שיהיה הרצף ארוך תושג דחיסה רבה יותר, שכן כמות המידע בתמונת I גבוהה בסדרי גודל. מצד שני, כאשר מתחילים בפיענוח זרם וידאו, למשל אחרי החלפת ערוץ בממיר, יש צורך להמתין להופעה של תמונת I כדי להתחיל את פענוח התמונות, שכן יתר התמונות מתבססות עליה. לכן תופיע תמונת I בדרך כלל בכל חצי שנייה.
MPEG-2 תומך בשני תקנים לקידוד ודחיסה של אותות שמע. MP3, שהופיע כבר ב-MPEG1, שופר ושודרג כדי לאפשר שמע ב-5 ערוצים, כמו במערכת [[קולנוע ביתי|קולנוע ביתי.]] כן נוספה שיטה חדשה ועדיפה - AAC. זרמי השמע והוידאו שהם כאמור זרמים נפרדים מכילים אותות תזמון כדי לסנכרן בין הסרט לפס הקול.
 
== ראו גם ==