ETL – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
שינוי טעות לשונית: קובצי >> קבצי
Matanyabot (שיחה | תרומות)
מ בוט החלפות: \1קובצי
שורה 7:
# בשלב השלישי (Load) נטענים הנתונים שעברו טרנספורמציה למחסן הנתונים.
 
בחלק מהארגונים תהליך ה-ETL הוא מורכב יותר ועשוי לכלול מספר קבציקובצי ביניים.
 
== קבצים המעורבים בתהליך ==
קבציקובצי המקור עשויים להיות רבים ושונים זה מזה, שמהווים חלק ממערכות תפעוליות בארגון. מבחינה טכנולוגית הם עשויים להיות [[בסיס נתונים|בסיסי נתונים]] יחסיים ובסיסי נתונים אחרים. הם עשויים להיות גם [[קובץ|קבצים]] מסוגים שונים. בנוסף לקבצים ובסיסי נתונים מתוך הארגון עשויים להיכלל [[נתון|נתונים]] המוזנים ידנית לתוך קבציקובצי הביניים ונתונים מקבצים מחוץ לארגון.
 
קבציקובצי הביניים וקבציוקובצי היעד הם בדרך כלל בסיסי נתונים יחסיים, כאשר בדרך כלל מוצר בסיס הנתונים שמשמש את מחסן הנתונים הוא המוצר המשמש לקבצילקובצי הביניים.
 
== תהליך ==
שורה 26:
* הבנת תלויות בין מקורות שונים העשויות להשפיע על פלט תהליך הוצאת הנתונים.
 
הבנת ההיבטים המתוארים לעיל מאפשרת גם קביעת עיתוי ביצוע שלב הוצאת הנתונים. בחלק מהמקרים ניתן לבצע שלב זה רק בחלון זמן מסוים שבו אין פעילות תהליכי אצווה עם קבציקובצי המקור העשויים לעדכן את הקבצים ופעילות [[עיבוד נתונים מקוון]] היא מועטת, ולכן הוצאת הנתונים אינה פוגעת ב[[רמת השירות]] של הטרנזקציות המקוונות.
 
=== שלב הטרנספורמציה - Transform ===
שורה 37:
* מיון - סידור רשומות בסדר עולה או יורד על פי שדה מפתח, למשל: סידור נתונים על מוצרים לפי מספר המוצר.
* אגרגציה - נתון של מכירות באזור, עשוי להיות מחושב באמצעות חיבור המכירות בכל הסניפים באותו אזור.
* שילוב נתונים ממספר קבציקובצי מקור לנתון אחד.
 
=== שלב הטעינה - Load ===
אוחזר מתוך "https://he.wikipedia.org/wiki/ETL"