המילון ההיסטורי ללשון העברית – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
שורה 28:
===הקמת מסד הנתונים===
השלב השני בהכנת המילון היה הכנת התשתית הטקסטואלית לצורך ליקוט חומר הגלם למילון. כל המקורות הספרותיים שנקבעו כבסיס למילון הועתקו ל[[מסד נתונים]] ממוחשב על פי כתב היד הטוב ביותר שלהם. עובדי המילון עברו על כל מילה במסד הנתונים ותייגו אותה לערך המילונאי שאליה היא משתייכת. בצורה זו הלכה ונוצרה קונקורדנציה רחבת היקף של כל המקורות העבריים הנכללים במאגר, ועובד המילון יכול היה לשלוף, תוך שניות בודדות, את כל המשפטים שבהם מופיעה מילה מסוימת בכל המקורות שהועלו למסד הנתונים.
 
בשנת 1994, לקראת סיום השלב של הקמת מסד הנתונים,1982 פירסמה האקדמיה ערך לדוגמה מתוך המילון. הערך שנקבע היה השורש ער"ב על כל נגזרותיו, כגון: מערב, ערובה, עירובון, ערביים וכו' (למעשה מדובר במספר שורשי ער"ב [[הומוגרפים|הומוגרפיים]]). הערך לדוגמה כולל 88 עמודים, והוא התפרסם בכתב העת "לשוננו" שמוציאה האקדמיה ללשון העברית.<ref>{{הערה|לשוננו מו (התשמ"ב), חוברת 4-3.</ref>}}
 
בשנת 1992, עם הגיעו לגיל 84, פרש פרופ' [[זאב בן חיים]] מניהול המילון, ותחתיו נתמנה פרופ' [[אברהם טל (בלשן)|אברהם טל]]. פרופ' טל החליט לפתוח את מסד הנתונים, שעד כה היה זמין לעובדי המילון בלבד, לציבור הרחב. בעקבות החלטתו זו יצא מספר שנים מאוחר יותר (1998) [[תקליטור]] הכולל את מסד הנתונים הממוחשב של התקופה העתיקה וכן [[תוכנה]] לחיפוש. תקליטור זה כונה "מאגרים".
 
בשנת 1994, לקראת סיום השלב של הקמת מסד הנתונים, פירסמה האקדמיה ערך לדוגמה מתוך המילון. הערך שנקבע היה השורש ער"ב על כל נגזרותיו, כגון: מערב, ערובה, עירובון, ערביים וכו' (למעשה מדובר במספר שורשי ער"ב [[הומוגרפים|הומוגרפיים]]). הערך לדוגמה כולל 88 עמודים, והוא התפרסם בכתב העת "לשוננו" שמוציאה האקדמיה ללשון העברית.<ref>לשוננו מו (התשמ"ב), חוברת 4-3.</ref>
 
מספר שנים מאוחר יותר, ועקב הצורך המתמיד לעדכן את מסד הנתונים, הוחלט לזנוח את פרסום המאגר באמצעות תקליטור, ולעבור לשיטה מקוונת. בשנת 2005, לאחר תקופת ניסיון קצרה, הועלה מסד הנתונים ל[[אתר אינטרנט|אתר האינטרנט]] של האקדמיה ללשון העברית, ושמו - כשם התקליטור - "מאגרים". הגרסה המקוונת של "מאגרים" נחנכה באופן רשמי על ידי ראש הממשלה [[אהוד אולמרט]] בעת ביקורו באקדמיה ב־19 ביוני 2006, והיא נגישה כיום תמורת דמי שימוש שנתיים.
 
[[תמונה:Maagarim.jpg|שמאל|ממוזער|250px|הגרסה המקוונת של "מאגרים"]]
 
כיום כולל מסד הנתונים את כל החיבורים העיקריים של הלשון העברית בעת העתיקה. כיום (2008) הוקלדו למאגר למעלה מ-4,500 חיבורים, הכוללים למעלה מתשעה מיליוני מלים, וקיימים בו למעלה מ-36,000 ערכים. העבודה על מסד הנתונים נמשכת באופן מתמיד, הן בשל הצורך לעדכן את המסד על פי התקדמות המחקר, והן משום שמעת לעת מתגלים חיבורים עתיקים נוספים.