MP3 – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Matanyabot (שיחה | תרומות)
מ בוט החלפות: \1ניסיו\2\3
שורה 1:
'''MP3''' הוא [[אלגוריתם]] פופולרי ל[[קידוד]] ו[[דחיסה מאבדת נתונים]] (lossy compression) של [[אות (סיגנל)|אותות]] שמע. מטרת ה[[אלגוריתם]] הינההיא לצמצם במידה ניכרת את כמות המידע הנחוצה לייצוג ה[[צליל]], אולם עדייןאך לאפשר שיחזור שישמע נאמן למקור לרוב המאזינים. המונח MP3 מתייחס גם ל[[קובץ|קובצי]] [[קול]] או [[מוזיקה]] השמורים בפורמט זה.
 
השם המלא של ה[[אלגוריתם]] הוא "MPEG-2 Audio Layer 3".
 
== רקע ==
שמירת אותות קוליים (אודיו) בצורה דיגיטלית דורשת נפח אחסון רב. איכות שמע של [[תקליטור]] שקידוד הסאונד שלו מבוצע בטכנולוגיית PCM או "[[Pulse Code Modulation]]", מושגת על ידי 44,100 רשימות (דגימות) של 32 [[סיבית|סיביות]] (מדובר בסטריאו - שני ערוצים של 16 [[סיבית|סיביות]] כל אחד) עבור כל [[שנייה]]. כלומר כ-1.4 מיליון סיביות לשנייה. אלגוריתמי דחיסה כלליים (כדוגמת [[PkZip|ZIP]]) אמנם מצליחים להקטין את נפח הקבצים, אבל לא ברמה הנחוצה. בפועל, עבור איכויות המוגדרות טובות (128 ועד 320 [[תחיליות במערכת היחידות הבינלאומית#קילו|קילו]]-[[סיבית|סיביות]] לשנייה), גדליגודל קובצי MP3 הינםהוא כ־10% - 20% מהגודל המקורי של הקובץ. לדוגמה -, שיר שאורכו 4 דקות, בקידוד רגיל של תקליטור ידרוש נפח של 40MB, אך כשדוחסים את אותו שיר בקידוד MP3 השיר ידרוש נפח של בערך 4MB בלבד.
 
== הרעיונות המרכזיים ==
[[קובץ:Mp3filestructure.svg|שמאל|ממוזער|250px|מבנה קובץ MP3]]
כדי להקטין את גודל הקובץ, משתמש האלגוריתם במספר מאפיינים שנובעים מהצורה בה המחהמוח והאוזן האנושית מעבדים קול:
 
# '''סף הרגישות''' (The minimal audition threshold) - המאזין הרגיל לא ישמע צלילים בעוצמות הנמוכות מסף מסוים. בניסויים בבני אדם נמצא שסף זה תלוי ב[[תדר]] הצליל. כמובן שסףסף זה אינו נכון עבור כל בני האדם, אולם הסף האישי עבור הרוב נמצא קרוב מאוד אליו. לכן נוכלניתן למחוק את כל הצלילים שלא עוברים את הסף ולדעת בסבירות גבוהה כי רוב המאזינים לא ירגישו בהבדל.
# '''הסתרות''' (The masking effect) - האופן בו נגיבתגובה לצליל מסוים תלויתלויה מאוד במכלול הצלילים שאותם אנו שומעים במקביל. הדבר דומה ל[[מערכת הראייה]] - נגיב באופן שונה לריבוע בצבע מסוים המופיע על גבי רקע בהיר או כהה, תחושת הצבע שלנו תהיה שונה. דוגמה אחרת היא כאשר לא נשים לב להבדלי גוון קטנים. לשם כך נבנו [[מערכת מודל|מודלים]] מתמטיים המתארים את תגובת האדם למכלול של צלילים, מודלים הנקראים מודלים פסיכו-אקוסטיים. רעיונות [[פסיכולוגיה|פסיכולוגיים]] קשים לכימות ולכן ישנם כמה מודלים, שונים במידה זו או אחרת זה מזה. נוכל לכן לבחור מודל מסוים ועל פיו להחליט אילו צלילים באמת נחוצים ואילו לא יחסרו למאזינים.
# '''קידוד סטריאו מאוחד''' (Joint Stereo coding) - בני האדם קולטים אותות קוליים דרך ה[[אוזניים]], הנמצאות במרחק זו מזו. הצלילים הנקלטים די דומים אולם ברוב המקרים אחד מהם עובר דרך קצת ארוכה יותר ולכן מגיע באיחור מה. [[מוח]] האדם משתמש בהפרשי הזמנים כדי לחשב את הכיוון ממנו הגיע הצליל (עקרונות פשוטים של [[גאומטריה]]), אולם תחושה זו נפגעת עבור תדרים גבוהים או נמוכים מאוד ויכולתו של האדם לחוש את כיוון מקור הצליל נחלשת. לכן, במקום לשמור את שני הערוצים, נוכל לשמור מידע של ערוץ אחד בלבד ובנוסף מידע מצומצם מאוד על המיקום. חיסכון נוסף עבור סטריאו ניתן להשיג עבור שני ערוצים דומים. במקרה כזה נוכל לקודד את סכומם ואת ההפרש שלהם במקום את הערוצים המקוריים (הסבר מלא לקוח מ[[תורת האינפורמציה]]).
# '''[[קוד הופמן|קידוד הופמן]]''' (Huffman coding) - השימוש בקידוד הופמן אינו שונה כאן מבכל מקום אחר. קטעי ביטים בעלי סבירות גבוהה מקודדים כמחרוזות קצרות ואילו קטעי ביטים בעלי סבירות נמוכה מקודדים כמחרוזות ארוכות יותר. בממוצע נקבל פחות ביטים. חלק זה משלים במידת מה את רעיון ההסתרות. בקטע קולי מגוון, ישנן הרבה הסתרות והרבה מאוד קטעי ביטים שונים, לכן נקבל חסכון בעזרת המודל הפסיכו-אקוסטי אולם לא נרוויח יותר מדי מקוד הופמן. במקרה ההפוך, כאשר נעבוד עם אותות פשוטים (המורכבים ממספר מצומצם של תדרים שונים), לא נחסוך הרבה ממחיקת ההסתרות אולם קוד הופמן ישיג תוצאות טובות יותר.
# '''מאגר ביטים''' (Bytes reservoir) - חלקים מסוימים עלולים לדרוש יותר סיביות מאחרים כדי להגיע לרמה סבירה של איכות. לחלופין, קטעים מסוימים יכולים להיות פשוטים יותר לקידוד מאחרים. לשם כך נוכל להשתמש במאגר ביטים כדי "להעבירם למקום בו הם נחוצים יותר".
 
שורה 21:
קובצי [[MP2]] הופיעו ב[[אינטרנט]] ב-[[1993]]. "מחתרת המוזיקה של האינטרנט" (ה-IUMA) נחשבת לתחילת מהפכת המוזיקה המקוונת. ה-IUMA אירח אלפי קבצים חוקיים של MP2. בשנת [[1995]], הפופולריות של קובצי ה-MP3 קיבלה תאוצה אדירה. הצלחה זו של הפורמט הניעה וגם נבעה מהצלחתם של נגני הקבצים (כגון [[Winamp]] של [[Nullsoft]]) ותוכנות ל[[שיתוף קבצים]] אשר התחילו עם [[נאפסטר]].
 
גודלם הקטן של קובצי MP3 ואיכות השמע הגבוהה יחסית איפשרהאפשרה את הפריחה חסרת התקדים בשימוש ברשתות שיתוף קבצים באינטרנט. תופעה אשר הפכה את המוזיקה לנגישה לכולם ועוררה שאלות רבות בנוגע לחוקי זכויות היוצרים במציאות החדשה.
 
היורש המתוכנן של MP3, על פי [[MPEG]], הינוהוא אלגוריתם ה-[[AAC]] המפורט בתקן 4-MPEG. זאת למרות שהיו ניסיונות ליצור ולהפיץ פורמטים אחרים. בכל מקרה, בגלל הפופולריות העצומה של MP3 - המתבטאת במגוון רחב של תוכנה וחומרה (כגון נגנים ניידים ונגני [[DVD]]) התומכים בה, קשה לראות "ירושה" בזמן הקרוב.
 
== איכות השמע והמקודדים ==
איכות הקידוד המינימאליתהמינימלית הנחוצה כדי ש[[קובץ]] ה-MP3 ישמע קרוב מספיק למקור הינההיא דבר סובייקטיביסובייקטיבית. האיכות המקובלת כסף תחתון הינההיא 128Kb/s, זאת למרות שמבחני שמיעה הראו כי עם מעט אימון רוב האנשים יוכלו להבחין בין הקובץ הדחוס למקור באיכות זו.
 
בעוד שתהליך השחזור (יצירת אותות קול מקובץ ה-MP3) הוגדר היטב וקבוע עבור האלגוריתם, אין אחידות בכל הנוגע לתהליך הקידוד. כתוצאה מכך ישנו מגוון רחב של מקודדים, המשתמשים במודלים פסיכו-אקוסטיים שונים, אשר יוצרים קובצי MP3 שונים. מקודד המיועד לאיכויות גבוהות (כגון LAME) לא יתפקד בהכרח בצורה טובה עבור איכויות נמוכות.
אוחזר מתוך "https://he.wikipedia.org/wiki/MP3"