פתיחת התפריט הראשי

ויקינתונים

מסד-נתונים חופשי של קרן ויקימדיה
ויקינתונים
Wikidata
Wikidata-logo-en.svg
ויקינתונים
דף הבית של ויקינתונים
תאריך ההקמה 30 באוקטובר 2012
מייסדים קהילת ויקימדיה
בעלות קרן ויקימדיה
דירוג אלכסה 9,525 (נכון ל־8 בדצמבר 2018) עריכת הנתון בוויקינתונים
שפות תכנות PHP עריכת הנתון בוויקינתונים
wikidata.org
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית OOjs UI icon info big.svg
צוות המפתחים של ויקינתונים

ויקינתוניםאנגלית: Wikidata) הוא מסד נתונים חופשי, שיתופי ורב-לשוני, השייך לקרן ויקימדיה. ויקינתונים משמש כמאגר נתונים מרכזי לכל המיזמים של קרן ויקימדיה, וניתן לעשות בנתונים שבו שימוש חופשי ברישיון נחלת הכלל.

תוכן עניינים

מהות המיזםעריכה

בדומה למיזם ויקישיתוף שמרכז את קובצי המדיה בהם נעשה שימוש במיזמי קרן ויקימדיה והמופצים ברישיון חופשי, ויקינתונים משמש כמאגר נתונים מרכזי וחופשי. ניתן להשתמש בנתונים בצורות שונות – ניתן להעתיק, לשנות, להפיץ או להציג את הנתונים, אפילו למטרות מסחריות, כל זאת מבלי לבקש רשות. כמו בשאר מיזמי קרן ויקימדיה, הנתונים בוויקינתונים מוכנסים ומתוחזקים על ידי העורכים שמחליטים על הכללים של יצירת תוכן וניהול המידע. עם זאת, גם בוטים יכולים להזין נתונים בוויקינתונים. ויקינתונים אוגר נתונים מובנים ומקושרים, דבר המקל על שימוש חוזר בנתונים, ומאפשר שימוש ועיבוד על ידי מחשבים.

ויקינתונים מהווה מאגר נתונים מרכזי עבור ויקיפדיה בשפות השונות, כמו גם לשאר מיזמי קרן ויקימדיה. ויקינתונים תומך בוויקיפדיה בקישורי שפה, כלומר, ערכים מקבילים בוויקיפדיות בשפות שונות מקושרים ביניהם באמצעות ויקינתונים. בנוסף, פרטי מידע רבים (כגון תאריכי הלידה או נתוני התמ"ג של מדינות) מאוחסנים במאגר וניתן לעשות בהם שימוש בתבניות מידע המופיעות בוויקיפדיות השונות ובמיזמים נוספים. באופן זה מתאפשר לעדכן נתונים במקביל בכל הערכים במהדורות השונות של ויקיפדיה ובמיזמים אחרים של קרן ויקימדיה או של גופים אחרים, דבר המקל על התחזוקה של ערכים, מצמצם את עומס העבודה, ומשפר את איכותה, מהימנותה ועדכניותה של ויקיפדיה.

מבנה ויקינתוניםעריכה

ויקינתונים פועל על תוכנת Wikibase – מקבץ של תוספים למדיה-ויקי[1] – והוא בסיס נתונים מסוג NoSQL.

פריטיםעריכה

מסד הנתונים מתמקד בפריטים, שיכולים לייצג כל נושא, מושג, אובייקט או ישות. לדוגמה, ‏אולימפיאדת סיאול‏ (Q8470), ‏אהבה‏ (Q316), ‏אלביס פרסלי‏ (Q303) או ‏גורילה‏ (Q36611). לכל פריט מספר מזהה ייחודי המתחיל באות Q ומכונה QID. התווית (label) של הפריט היא השם המקובל לפריט בשפה מסוימת, וניתן להזין תווית בכל שפה נתונה. בצורה זו ניתן לזהות את הפריט ולהציג מידע בסיסי עבורו בצורה שאינה מתעדפת שפה אחת על פני השנייה.

תוויות של פריטים לא מוכרחות להיות ייחודיות. למשל, ‏מורה‏ (Q37226), ‏מורה‏ (Q521164), ‏מורה‏ (Q204040), ו-‏מורה‏ (Q849874) הם פריטים המתייחסים לישויות שונות בתכלית: הראשון הוא אדם העוסק בהוראה, השני יחידה פונולוגית, השלישי נהר במרכז אירופה והרביעי עיירה בשוודיה.

בעיקרון, כל פריט מורכב מתווית, תיאור, ומספר קביעות או הצהרות (statements).

 
התרשים מראה את המונחים והמושגים החשובים ביותר בוויקינתונים

קביעוֹתעריכה

מידע על פריטים מאורגן בצורה של קביעות. באופן פורמלי, אלה הן הצהרות המורכבות מצמדים של תכונה (או מאפיין, property) וערך (value). למשל, עבור הפריט ‏אוורסט‏ (Q513), התכונה ‏שיא גובה‏ (P2660) תקבל את הערך 8,848 מטר; עבור הפריט ‏שרלוק הולמס‏ (Q4653) התכונה ‏יוצר‏ (P170) תקבל את הערך ‏ארתור קונאן דויל‏ (Q35610) – שהוא פריט ויקינתונים בפני עצמו. תכונות יכולות לקבל ערכים מסוגים שונים: מספרים, פריטים אחרים בוויקינתונים, מחרוזות (למשל, ‏שם בשפת אם‏ (P1559)), או קובצי מדיה (למשל, ‏תמונה‏ (P18)).

לכל תכונה נקבע סוג הערכים שהיא יכולה לקבל. למשל, התכונה ‏אתר רשמי‏ (P856) צריכה לקבל ערך מהסוג URL. תכונות יכולות גם להגדיר אילוצים (constraints) - כללים מורכבים יותר לגבי השימוש המיועד שלהם,. לדוגמה, לתכונה ‏עיר בירה‏ (P36) יש "אילוץ חד-ערכי", המשקף את המציאות כי לטריטוריות יש (בדרך כלל) רק עיר בירה אחת. עם זאת, המודל של ויקינתונים הוא מאוד גמיש: היחס לאילוצים אינו כאל כללים שאין להפר אותם אלא כהכוונה לעורכים[2].

קביעות יכולות למפות תכונה אחת ליותר מערך אחד. למשל, התכונה של ‏עיסוק‏ (P106) תקבל אצל מארי קירי הן את הערך ‏פיזיקאי‏ (Q169470) והן את הערך ‏כימאי‏ (Q593644).

מגדירים הם דרך אופציונלית בה ניתן לדייק קביעה כלשהי על ידי הוספת מידע בנוגע להיקף ההצהרה. למשל, התכונה ‏אוכלוסייה‏ (P1082) יכולה לקבל ערך מספרי מסוים, וניתן לדייק את ההצהרה ולציין במגדיר ‏נקודת זמן‏ (P585) את הערך "שנת 2017".

קביעות יכולות גם לכלול הפניה למקורות כדי לתת סימוכין להצהרה.

היסטוריה ופיתוחעריכה

 
סמליל מיוחד שעיטר את אתר האינטרנט של המיזם ב-2014, בשבוע בו חגג ויקינתונים שנתיים להשקתו

המיזם נוצר ביוזמת ויקימדיה גרמניה, ובמימון מענקים מהמכון לבינה מלאכותית של פול אלן, מקרן גורדון ובטי מור, ומגוגל, בסך של 1.3 מיליון אירו[3][4]. זהו המיזם החדש הראשון של קרן ויקימדיה מאז 2006. פיתוח המיזם נעשה בעיקר על ידי ויקימדיה גרמניה וכלל שלושה שלבים:

  1. ריכוז קישורים בין-לשוניים - קישורים בין ערכים בוויקיפדיה על אותו נושא בשפות שונות
  2. אחסון מרכזי לנתונים שבתבניות מידע מכל הוויקיפדיות
  3. יצירה ועדכון של רשימות ערכים על סמך נתונים בוויקינתונים

השקה ראשוניתעריכה

המיזם הושק באופן רשמי ב-30 באוקטובר 2012 וכלל תחילה רק קישורים בין-לשוניים. בעבר, כל ערך בוויקיפדיה כלל רשימה של קישורים לערך המקביל בוויקיפדיות אחרות. ויקינתונים היווה בשלב ראשון מאגר מרכזי של קישורים אלה: כל פריט שנוצר בוויקינתונים הכיל רק מידע בסיסי: תווית, תיאור וכינויים (תוויות אלטרנטיביות) וקישורים לערכים בנושא בוויקיפדיות השונות.

המהדורה הראשונה של ויקיפדיה שבה שולבו קישורים בין-לשוניים דרך מסד הנתונים של ויקינתונים הייתה ויקיפדיה ההונגרית, שבה שולבו הקישורים ב-14 בינואר 2013. קישורים בין-לשוניים דרך ויקינתונים נכנסו לשימוש לאחר מכן בוויקיפדיה העברית וויקיפדיה האיטלקית, ב-30 בינואר 2013[5], ב-11 בפברואר 2013 בוויקיפדיה האנגלית, -ב-6 במרץ 2013 בכל שאר הוויקיפדיות.

הוספת הצהרותעריכה

ב-4 בפברואר 2013 החלה הוספת ההצהרות לויקינתונים. הנתונים יובאו בחלקם בצורה אוטומטית מתבניות מידע וקטגוריות שבערכי ויקיפדיה. ב-27 במרץ 2013 החלו השילוב של ויקינתונים - תחילה ב-11 ויקיפדיות, ומ-23 באפריל בכל המהדורות בשפות השונות של ויקיפדיה. ב-22 ביולי 2013 מסד הנתונים השתלב עם המהדורות השונות של מיזם "ויקימסע" וב-14 בינואר 2014 השתלב גם עם ויקיטקסט.

שליפת מידעעריכה

החל מהשלב השלישי של הפיתוח ניתן לייצר רשימות אוטומטיות של נתונים ולייצאם. ב-7 בספטמבר 2015, קרן ויקימדיה הכריזה על השקת ממשק השאילתות של ויקינתונים[6] המאפשר למשתמשים לתשאל את מסד הנתונים באמצעות SPARQL. שירות זה מאפשר למשתמשים לקבל תשובות לסוגים שונים של שאלות, כגון "מהן עשר הערים הגדולות בעולם בהן מכהנת אישה בתפקיד ראש העיר"[4], "באיזה יצירות אמנות מופיע מגדל אייפל" או "כמה אנשים קיבלו גם פרס אוסקר וגם פרס נובל".

נכון לנובמבר 2018, יש לפחות 26 כלים שונים המאפשרים לתשאל את ויקינתונים הנתונים בדרכים שונות[7].

לוגועריכה

הברקוד בלוגו של ויקינתונים מכיל את המילה "ויקי" בקוד מורס.

קישורים חיצונייםעריכה

הערות שולייםעריכה