גוגל ספרים – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
מ אחידות במיקום הערות שוליים ביחס לסימני פיסוק, ויקישיתוף בשורה, הגהה |
|||
שורה 1:
{{אתר אינטרנט|
|שם=גוגל ספרים
|לוגו=[[
|תמונה=[[
|כתובית=הצגה של ספר ב"תצוגה מלאה"
|סוג=[[ספרייה מקוונת]]
שורה 17:
==רקע==
ה[[יזמות עסקית|יוזמה]] זכתה לתשבחות רבות בזכות הפוטנציאל הגלום במתן גישה חסרת תקדים למה שיכול להפוך ל[[אוסף|קורפוס]] ה[[קו תקשורת|מקוון]] הגדול ביותר של ה[[ידע]] האנושי,{{הערה|1=
{{cite news |first=Kevin |last=Bergquist |title=Google project promotes public good |url=http://www.umich.edu/~urecord/0506/Feb13_06/02.shtml |work=The University Record |publisher=University of Michigan |date=2006-02-13 |accessdate=2007-04-11 }}}}{{הערה|1={{cite web |title=Is This the Renaissance or the Dark Ages? |last=Pace |first=Andrew K. |url=http://www.ala.org/ala/alonline/techspeaking/2006columnsa/techJan2006.cfm |month=January | year=2006 |work=American Libraries |publisher=American Library Association |accessdate=2007-04-11}}}} ובקידום ה[[דמוקרטיה|דמוקרטיזציה]] של ה[[ידע]]
תוצאות מ"גוגל חיפוש ספרים" מופיעות בחיפוש כללי ב[[אינטרנט]] הן ב[[URL|כתובת]] [[גוגל (מנוע חיפוש)|google.com]] והן דרך אתר ייעודי של גוגל ספרים: (books.google.com). בחיפוש כללי באתר גוגל עשויות להופיע עד שלוש תוצאות מה[[מדריך אתרים|אינדקס]] של גוגל ספרים, ובמקרים רלוונטיים, הן יופיעו מעל תוצאות החיפוש האחרות.
לחיצה של [[משתמש קצה|משתמשי]] השירות על תוצאה ב"גוגל ספרים" תפתח בפניהם [[ממשק משתמש|ממשק]] בו יכול המשתמש לעיין ב[[דף|דפים]] מתוך הספר, כאשר חוקי [[זכויות יוצרים]] או בעל זכויות היוצרים מאפשרים זאת. ספרים הנמצאים ב[[רשות הציבור]] (בארצות הברית) זמינים ל"תצוגה מלאה" ולהורדה ב[[חינם]]. גוגל מגבילה את מספר העמודים הניתנים לצפייה עבור ספרים שעדיין [[דפוס|מודפסים]], באמצעות מגוון רחב של מגבלות גישה ואמצעי אבטחה, שחלקם מבוססים על מעקב אחר המשתמש
לצד תוצאות החיפוש מופיעות [[פרסום|פרסומות]] הקשורות לתוכן החיפוש, אך הן לא מופיעות ליד ספרים הנצפים בתצוגה מקדימה. האתר מספק [[קישור אינטרנט|קישורים]] לאתר האינטרנט של ה[[מוציא לאור]] ו[[מכירה|מוכרי]] ספרים.
מסד הנתונים של "גוגל ספרים" מוסיף להתרחב, אך היות שגוגל חייבת לוודא שה[[יצירה|יצירות]] מעוגנות בחוקי הזכויות יוצרים המקומיים, הוא אינו נגיש במלואו עבור משתמשים מחוץ ל[[ארצות הברית]]. לדברי איש צוות התמיכה של האתר, "מאחר שהשאלה אם ספר מסוים נמצא ברשות הציבור היא לעתים קרובות שאלה [[משפטים|משפט]]ית סבוכה, אנו נוקטים במשנה זהירות ומציגים לכל היותר מספר קטעי טקסט עד אשר נקבע כי הספר יצא לנחלת הכלל"
בשנת 2010 העריכה גוגל שמספר הספרים בעולם כולו עומד על כ-130 מיליון ספרים ייחודיים (129,864,880 ליתר דיוק, כ-20 אחוז מתוכם נמצאים ברשות הציבור). מנהל [[הנדסה]] בפרויקט מסר כי גוגל מתכוונת לסרוק את כולם בתוך עשור, והם יסתכמו בלמעלה מ-4 מיליארד דפים דיגיטליים ו-4 טריליון מילים. ב-14 באוקטובר 2010 הוצגו באתר מעל 15 מיליון ספרים סרוקים
בארכיון האתר זמינים בתצוגה מלאה או חלקית מספר רב של חיבורים בשפה העברית, חלקם [[כתבי קודש|ספרי קודש]] מ[[המאה ה-12]] ואילך.
== אופן הסריקה ==
חלק גדול מהספרים נסרקים באמצעות מנגנון סריקה המורכב משתי [[מצלמה|מצלמות]] מהירות המצלמות את תוכן הדף, וממצלמת אינפרא אדום המצלמת את ממדי הדף, על מנת שהמחשב המצורף למערכת יוכל לחשב היכן הדף עקום (בדרך כלל באזור הכריכה) ולתקן בהתאם. כדי למנוע תופעות של דילוג על דפים בטעות במהלך תהליך הדפדוף המייגע, גוגל פיתחה מערכת המשמיעה [[שיר עבודה|צליל במרווחי זמן קבועים]] שאמורים להעניק למפעיל המערכת תחושת קצב בעלעול הדפים. המערכת עשויה גם להשמיע צליל שגיאה במקרה דילוג או כשידו של המפעיל נמצאת בתוך התמונה
חלק מהמצלמות הנמצאות בשימוש בגוגל סורקות בתדירות של 1,000 [[עמוד (נייר)|עמודים]] ל[[שעה]], ובאיכות של 11 מגה פיקסל לכל עמוד
בספטמבר [[2009]] רכשה גוגל את [[reCAPTCHA]], שעושה שימוש במנגנון אנושי, [[CAPTCHA]], כדי לזהות מילים שתוכנת זיהוי התווים לא הצליחה לזהות בבירור.
שורה 41:
בעוד ש"גוגל ספרים" סרקה מספר רב של כתבי עת, סריקות אלו אינן כוללות את המידע הנדרש ל[[Metadata|זיהוי מאמרים ספציפיים]] בנושאים מוגדרים. נושא זה הוביל לתוכנית נפרדת בשם [[Google Scholar]], ה[[ספרתי|מספרתת]] (מבצעת דיגיטציה) ומאחסנת גם מאמרים מכתבי עת ישנים (בהסכם עם המו"לים שלהם).
הפרויקט עורר טענות בקרב חוגים [[אינטלקטואל
בהקשר זה וכדי לתת מענה אירופי למיזם הספרים של גוגל, נפתח בנובמבר 2008 ביוזמת [[האיחוד האירופי]] אתר [[אירופיאנה]]. נכון לסוף שנת 2010 מקשר האתר לכ-14.6 מיליון אובייקטים דיגיטליים
טענה נוספת שהועלתה כנגד הפרויקט הייתה שהוא מוביל ל[[מונופול
בין האתרים המציעים או הציעו שירות דומה:
שורה 51:
*[[מיקרוסופט]] החלה בפרויקט דומה בשם "לייב סרצ' בוקס" (Live Search Books) שהושק בסוף 2006. השירות פעל עד לנטישתו במאי 2008.{{כ}}{{הערה|1={{cite news |first= |last= |authorlink= |coauthors= |title=Microsoft starts online library in challenge to Google Books |url=http://www.theage.com.au/news/biztech/microsoft-starts-online-library-in-challenge-to-google-books/2006/12/07/1165081127665.html|work=AFP |date= 2006-12-08|accessdate=2008-11-24 | location=Melbourne}}}} לאתר נסרקו 750.000 ספרים ו-80,000,000 כתבות עיתונות. כל הספרים שהועלו לאתר זמינים בארכיון האינטרנט, שהוא [[ארגון ללא כוונת רווח]], והפרויקט השני בגודלו אחרי גוגל בתחום סריקת הספרים. נכון לאוקטובר 2010, האתר מכיל יותר מ-2.5 מיליון ספרים סרוקים. חברת קירטאס (Kirtas) טכנולוגיות הייתה ספקית הדיגיטציה הגדולה ביותר שנבחרה על ידי מיקרוסופט עבור הפרויקט Live Search. בחודש יוני 2009 השיקה החברה את האתר KirtasBooks.com, שמכיל כמיליון כותרים מספריות המשתתפות בפרויקט כדי לספק הדפסה באיכות גבוהה והורדה דיגיטלית.
*אתר [http://en.wikipedia.org/wiki/Gallica גאליקה] של [[הספרייה הלאומית של צרפת]] מקשר לכ-800,000 [[ספר דיגיטלי|ספרים דיגיטליים]], עיתונים, כתבי יד, מפות וציורים, וכו'. הספרייה הדיגיטלית מוסיפה להתרחב מאז שנת היווסדה ב-1997, בקצב של כ-5000 מסמכים חדשים לחודש. חלק הארי מהמסמכים הסרוקים, הכתובים רובם ב[[צרפתית]], זמינים לעיון בפורמט של תמונה וטקסט מאז סוף 2008.
*[http://en.wikipedia.org/wiki/HathiTrust HathiTrust] מחזיקה את הספרייה הדיגיטלית HathiTrust מאז 13 אוקטובר 2008
==ציוני דרך משמעותיים==
שורה 96:
בתעשיית ההוצאה לאור ובאיגודי [[סופר]]ים מתחו ביקורת על הכללת גזירי טקסט של יצירות מוגנות בזכויות יוצרים, וראו בכך הפרת זכויות. איגוד המו"לים האמריקאי ו[[גילדה|גילדת]] הסופרים (כל אחד בנפרד) תבעו בסוף שנת 2005 את גוגל על "הפרת זכויות יוצרים מסיבית". בתגובה טענה גוגל שהפרויקט הינו המקביל הדיגטלי לכרטסת [[קטלוג|קיטלוג]] מסורתית, והוא מעוגן ב[[שימוש הוגן]], משום שהציטוט המוצג בגזירי הטקסט הוא קצר ודומה באורכו לתוצאות החיפוש שמפנה לאתרים, או לציטוט המופיע בביקורת ספרותית. על אף האמצעים שנקטה גוגל, בכך שסיפקה טקסט מלא רק לספרים הנמצאים ברשות הציבור, תוך הגבלת העיון בספרים מוגנים לקטעי טקסט בני מספר שורות בלבד, המול"ים טענו שאין לגוגל זכות להעתיק ספרים מוגנים שלמים, ולאחסן אותם בכמויות גדולות במסד הנתונים שלה תמורת רווח כספי.
לאחר שנתיים וחצי של [[משא ומתן]], גוגל חתמה בשנת 2008 על הסדר עם תעשיית המולי"ם ואיגוד הסופרים בארצות הברית, בו היא הסכימה לשלם סך של 125,000,000 דולר לבעלי הזכויות של הספרים שסרקה. גוגל התחייבה
בנוסף, ההסדר עורר התנגדות בקרב מספר ארגונים אמריקאיים שלא היו חלק מהתביעה וההסדר, ביניהם ארגון הסופרים והעיתונאים האמריקאי ואיגוד ה[[אמנות חזותית|אמנים החזותיים]], שמתחו ביקורת גורפת על ההסדר והגישו תביעות נוספות. ספריית הווארד התריעה בעקבות ההסדר שתיסוג מהפרויקט אם גוגל לא תחדל לסרוק ספרים מוגנים.
שורה 104:
בשנת 2009 נקנסה גוגל בסך 300,000 € על ידי בית משפט אזרחי ב[[פריז]], שהורה לגוגל לשלם 10,000 € ליום עד להסרת ספרי המו"ל התובע ממסד הנתונים שלה. בית המשפט כתב כי "גוגל הפרה את זכויות היוצרים של המחברים בכך שסרקה ואפשרה גישה לספרים שבבעלות המו"ל ללא אישורה" גוגל ערערה על הפסק בערכאה גבוהה יותר. הסופרת הסינית מיאן מיאן הגישה באותה שנה תביעה אזרחית נגד גוגל על סך 8,900 $, בגין סריקת ה[[רומן]] שלה "אוהבי חומצה". זוהי התביעה הראשונה נגד גוגל ב[[סין]].
גוגל הגיבה לביקורת המתמשכת בציינה שסריקת הספרים ואחסונם באינטרנט מגנה על המורשת התרבותית של העולם; סרגיי ברין, אחד ממייסדי גוגל אמר כי "[[ספריית אלכסנדריה|הספרייה המפורסמת]] של [[אלכסנדריה]] [[שריפה|נשרפה]] שלוש פעמים, בשנת 48 לפנה"ס, 273 לספירה ו-640 לספירה, כמו גם [[ספריית הקונגרס]], שם החריבה האש בשנת 1851 שני שלישים מהארכיון. אני מקווה שלא יקרה שוב הרס כזה, אולם ההיסטוריה מצביעה אחרת"
מומחים למשפט בארצות הברית טענו כי הפרויקט מסכן את [[דוקטרינה|דוקטרינת]] השימוש הוגן, כיוון שבפרויקט נעשה שימוש בטענת השימוש הוגן בממדים כה אדירים שהוא עלול לגרום להגבלה משפטית של זכות זו. מאחר שאיגוד המולי"ם הגיעה בסוף להסדר עם גוגל, המחלוקת על הגבלות השימוש הוגן נותרה בינתיים בלתי פתורה.
==ביקורת על השירות==
מספר גופים הצביעו על בעיות איכות שהתגלו בסריקות ובתהליך ההמרה לטקסט. ה[[מגזין]] [[דר שפיגל]] מבקר תכופות את החוסר ב[[Metadata|מטה-דטה]] ואת איכות הסריקה - שלמרות שנעשית בתהליך ידני התגלו בה טעויות גדולות, כמו כיתוב שגוי של שמות מחברים או שמות ההוצאה לאור, דפים חסרים מתוך הספר או דפים בלתי קריאים
==קישורים חיצוניים==
{{ויקישיתוף בשורה}}
* [http://books.google.co.il/ האתר]
==הערות שוליים==
|