גוגל ספרים – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ אחידות במיקום הערות שוליים ביחס לסימני פיסוק, ויקישיתוף בשורה, הגהה
שורה 1:
{{אתר אינטרנט|
|שם=גוגל ספרים
|לוגו=[[תמונהקובץ:U8888Kntitled.jpg|מרכז|160px]]
|תמונה=[[תמונהקובץ:Google Books Hamlet.png|מרכז|160px]]
|כתובית=הצגה של ספר ב"תצוגה מלאה"
|סוג=[[ספרייה מקוונת]]
שורה 17:
==רקע==
ה[[יזמות עסקית|יוזמה]] זכתה לתשבחות רבות בזכות הפוטנציאל הגלום במתן גישה חסרת תקדים למה שיכול להפוך ל[[אוסף|קורפוס]] ה[[קו תקשורת|מקוון]] הגדול ביותר של ה[[ידע]] האנושי,{{הערה|1=
{{cite news |first=Kevin |last=Bergquist |title=Google project promotes public good |url=http://www.umich.edu/~urecord/0506/Feb13_06/02.shtml |work=The University Record |publisher=University of Michigan |date=2006-02-13 |accessdate=2007-04-11 }}}}{{הערה|1={{cite web |title=Is This the Renaissance or the Dark Ages? |last=Pace |first=Andrew K. |url=http://www.ala.org/ala/alonline/techspeaking/2006columnsa/techJan2006.cfm |month=January | year=2006 |work=American Libraries |publisher=American Library Association |accessdate=2007-04-11}}}} ובקידום ה[[דמוקרטיה|דמוקרטיזציה]] של ה[[ידע]].{{הערה|שם=spiegel|1=[http://www.spiegel.de/international/business/0,1518,473529-2,00.html Malte Herwig, "Google's Total Library", ''Spiegel Online International'', Mar. 28, 2007.]}}. אולם האתר אינו חף גם מביקורת על פוטנציאל הפרות [[זכויות יוצרים]] הקיים בו.{{הערה|שם=spiegel}}{{הערה|שם=LAWSUITS|1={{cite news |authorlink= |coauthors= |title=Some Fear Google's Power in Digital Books |url=http://www.nytimes.com/2009/02/02/technology/internet/02link.html?em |work=New York Times |date=February 1, 2009 |accessdate=2009-02-02 | first=Noam | last=Cohen}}.}}
 
תוצאות מ"גוגל חיפוש ספרים" מופיעות בחיפוש כללי ב[[אינטרנט]] הן ב[[URL|כתובת]] [[גוגל (מנוע חיפוש)|google.com]] והן דרך אתר ייעודי של גוגל ספרים: (books.google.com). בחיפוש כללי באתר גוגל עשויות להופיע עד שלוש תוצאות מה[[מדריך אתרים|אינדקס]] של גוגל ספרים, ובמקרים רלוונטיים, הן יופיעו מעל תוצאות החיפוש האחרות.
 
לחיצה של [[משתמש קצה|משתמשי]] השירות על תוצאה ב"גוגל ספרים" תפתח בפניהם [[ממשק משתמש|ממשק]] בו יכול המשתמש לעיין ב[[דף|דפים]] מתוך הספר, כאשר חוקי [[זכויות יוצרים]] או בעל זכויות היוצרים מאפשרים זאת. ספרים הנמצאים ב[[רשות הציבור]] (בארצות הברית) זמינים ל"תצוגה מלאה" ולהורדה ב[[חינם]]. גוגל מגבילה את מספר העמודים הניתנים לצפייה עבור ספרים שעדיין [[דפוס|מודפסים]], באמצעות מגוון רחב של מגבלות גישה ואמצעי אבטחה, שחלקם מבוססים על מעקב אחר המשתמש.{{הערה|1={{cite web| author=Greg Duffy | title= Google's Cookie and Hacking Google Print | month= March | year= 2005 | url=http://www.kuro5hin.org/story/2005/3/7/95844/59875| work= [[Kuro5hin]]}}.}} מספרים שבעליהם לא זוהו והעשויים להיות מוגנים בזכויות יוצרים, ניתן לצפות רק בקטע מזערי של כ-2-3 שורות, אך הטקסט המלא של הספר זמין לחיפוש.
 
לצד תוצאות החיפוש מופיעות [[פרסום|פרסומות]] הקשורות לתוכן החיפוש, אך הן לא מופיעות ליד ספרים הנצפים בתצוגה מקדימה. האתר מספק [[קישור אינטרנט|קישורים]] לאתר האינטרנט של ה[[מוציא לאור]] ו[[מכירה|מוכרי]] ספרים.
 
מסד הנתונים של "גוגל ספרים" מוסיף להתרחב, אך היות שגוגל חייבת לוודא שה[[יצירה|יצירות]] מעוגנות בחוקי הזכויות יוצרים המקומיים, הוא אינו נגיש במלואו עבור משתמשים מחוץ ל[[ארצות הברית]]. לדברי איש צוות התמיכה של האתר, "מאחר שהשאלה אם ספר מסוים נמצא ברשות הציבור היא לעתים קרובות שאלה [[משפטים|משפט]]ית סבוכה, אנו נוקטים במשנה זהירות ומציגים לכל היותר מספר קטעי טקסט עד אשר נקבע כי הספר יצא לנחלת הכלל".{{הערה|1={{Cite web | author= Ryan Sands | title= From the mail bag: Public domain books and downloads | work= Inside Google Book Search |format=blog| date= November 9, 2006 | url=http://booksearch.blogspot.com/2006/11/from-mail-bag-public-domain-books-and.html}}.}} עם זאת, משתמשים מחוץ לארצות הברית יכולים לגשת למספר גדול של ספרים הנמצאים ברשות הציבור ונסרקו על ידי גוגל, באמצעות עותקים המאוחסנים ב[[ארכיון האינטרנט]].{{הערה|1=[http://www.archive.org/details/googlebooks Archive.org]}}.
 
בשנת 2010 העריכה גוגל שמספר הספרים בעולם כולו עומד על כ-130 מיליון ספרים ייחודיים (129,864,880 ליתר דיוק, כ-20 אחוז מתוכם נמצאים ברשות הציבור). מנהל [[הנדסה]] בפרויקט מסר כי גוגל מתכוונת לסרוק את כולם בתוך עשור, והם יסתכמו בלמעלה מ-4 מיליארד דפים דיגיטליים ו-4 טריליון מילים. ב-14 באוקטובר 2010 הוצגו באתר מעל 15 מיליון ספרים סרוקים,{{הערה|1={{cite web|url=http://booksearch.blogspot.com/2010/10/on-future-of-books.html |title=On the Future of Books |accessdate=2010-10-16 |publisher=[[גוגל (חברה)|Google]] }},}} רובם הגדול ספרים שאינם מודפסים יותר או שאזלו מ[[חנות ספרים|חנויות הספרים]] (בארצות הברית, [[בריטניה]] או [[אוסטרליה]]).{{הערה|שם=pcworldscan|1={{cite news |first= |last= |authorlink= |coauthors= |title=In Google Book Settlement, Business Trumps Ideals|url=http://www.pcworld.com/businesscenter/article/153085/in_google_book_settlement_business_trumps_ideals.html |work=PC World |date=October 28, 2008|accessdate=2008-10-31 }}.}}. למרות זאת, משתמשי השירות מעיינים בלא פחות מ-80 אחוז מתוך 15 מיליון הספרים הדיגיטליים הללו לפחות פעם חודש.{{הערה|1=[http://www.telegraph.co.uk/culture/8296365/The-best-online-culture-archives.html The best online culture archives], באתר הטלגרף, פברואר 2011}}.
 
בארכיון האתר זמינים בתצוגה מלאה או חלקית מספר רב של חיבורים בשפה העברית, חלקם [[כתבי קודש|ספרי קודש]] מ[[המאה ה-12]] ואילך.
 
== אופן הסריקה ==
חלק גדול מהספרים נסרקים באמצעות מנגנון סריקה המורכב משתי [[מצלמה|מצלמות]] מהירות המצלמות את תוכן הדף, וממצלמת אינפרא אדום המצלמת את ממדי הדף, על מנת שהמחשב המצורף למערכת יוכל לחשב היכן הדף עקום (בדרך כלל באזור הכריכה) ולתקן בהתאם. כדי למנוע תופעות של דילוג על דפים בטעות במהלך תהליך הדפדוף המייגע, גוגל פיתחה מערכת המשמיעה [[שיר עבודה|צליל במרווחי זמן קבועים]] שאמורים להעניק למפעיל המערכת תחושת קצב בעלעול הדפים. המערכת עשויה גם להשמיע צליל שגיאה במקרה דילוג או כשידו של המפעיל נמצאת בתוך התמונה.{{הערה|[http://hi.baidu.com/corylus/blog/item/996c63f4fd9ce6d2f2d385da.html Google’s Book Scanning Technology Revealed]}}.
 
חלק מהמצלמות הנמצאות בשימוש בגוגל סורקות בתדירות של 1,000 [[עמוד (נייר)|עמודים]] ל[[שעה]], ובאיכות של 11 מגה פיקסל לכל עמוד.{{הערה|שם=nyt|1={{cite news |first=Kevin |last=Kelly |authorlink= |coauthors= |title=Scan This Book! |url=http://www.nytimes.com/2006/05/14/magazine/14publishing.html?_r=1&oref=slogin&pagewanted=all |publisher=New York Times Magazine |date=May 14, 2006 |accessdate=2008-03-07 }}.}} ב[[אוניברסיטת סטנפורד]], אחת משותפותיה של גוגל בפרויקט הסריקה, נעשה שימוש במפעיל אנושי המניח את הספר על משטח יציב, כאשר [[רובוט]] [[פנאומטיקה|פנאומטי]] הופך את הדפים - בעדינות מספקת כדי לטפל בספרים נדירים - תחת עיניה הסורקת של המצלמה הדיגטלית.
 
בספטמבר [[2009]] רכשה גוגל את [[reCAPTCHA]], שעושה שימוש במנגנון אנושי, [[CAPTCHA]], כדי לזהות מילים שתוכנת זיהוי התווים לא הצליחה לזהות בבירור.
שורה 41:
בעוד ש"גוגל ספרים" סרקה מספר רב של כתבי עת, סריקות אלו אינן כוללות את המידע הנדרש ל[[Metadata|זיהוי מאמרים ספציפיים]] בנושאים מוגדרים. נושא זה הוביל לתוכנית נפרדת בשם [[Google Scholar]], ה[[ספרתי|מספרתת]] (מבצעת דיגיטציה) ומאחסנת גם מאמרים מכתבי עת ישנים (בהסכם עם המו"לים שלהם).
 
הפרויקט עורר טענות בקרב חוגים [[אינטלקטואל|אינטלקטואליים]]יים ופוליטיים ב[[אירופה]], שהביעו חשש מ"[[אימפריאליזם]] של [[השפה האנגלית]]". לטענתם, היות שהרוב המכריע של הספרים מוצגים בשפה זו, הדבר גורם לייצוג לא פרופורציונלי של ה[[שפה טבעית|שפות הטבעיות]] בעולם המקוון. [[גרמנית]], [[רוסית]], ו[[צרפתית]] לדוגמה, הן שפות נפוצות בעולם הידע וה[[ספרות]]; הדגש הבלתי-מידתי על אנגלית עלול לעצב את אופן הגישה לידע ו[[מחקר]] היסטורי, ובסופו של דבר, גם את אופיה וכיוונה בעתיד. בין המבקרים הללו נמנה ז'אן נואל, [[נשיא (ארגון)|נשיא]] ה"[[הספרייה הלאומית של צרפת|ביבליוטק נשיונל דה פראנס]]".{{הערה|1={{cite book | isbn=0-226-39577-4 |author=[[Jean-Noël Jeanneney]] |title=Google and the Myth of Universal Knowledge: A View from Europe |format=book abstract; Foreword by Ian Wilson |date=2006-10-23 |accessdate=2007-02-21}}.}}
 
בהקשר זה וכדי לתת מענה אירופי למיזם הספרים של גוגל, נפתח בנובמבר 2008 ביוזמת [[האיחוד האירופי]] אתר [[אירופיאנה]]. נכון לסוף שנת 2010 מקשר האתר לכ-14.6 מיליון אובייקטים דיגיטליים,{{הערה|על פי [http://europeana.eu/portal/aboutus.html עמוד האודות] באתר המיזם}}, למעלה מ-3.4 מיליון מתוכם הם ספרים,{{הערה|1={{cite news |url=http://version1.europeana.eu/c/document_library/get_file?uuid=ea9f2b40-1730-4ab0-a3d6-5b3f2a051edb&groupId=10602 |language=EN |title=Highlights of Europeana v1.0, pg 5 |date= |accessdate= |publisher=European Commission}},}} והוא כולל גם פריטי [[וידאו]], [[תצלום|תמונות]], [[ציור]]ים, [[סאונד|אודיו]], [[מפה|מפות]], [[כתב יד (העתק)|כתבי יד]], ספרים מודפסים, ו[[עיתון|עיתונים]], המתעדים 2000 שנות [[היסטוריה]] [[אירופה|אירופית]] ושנאספו מלמעלה מ-1,500 [[ארכיון|ארכיוני]] האיחוד האירופי.{{הערה|1={{cite news |first= |last= |authorlink= |coauthors= |title=Europe's Answer to Google Book Search Crashes on Day 1 |url=http://blog.wired.com/business/2008/11/eu-launches-mas.html |quote= |work=Wired |year=2008 |accessdate=2008-11-24 }}.}}
 
טענה נוספת שהועלתה כנגד הפרויקט הייתה שהוא מוביל ל[[מונופול|מונופוליזציה]]יזציה וריכוז של הידע בידי [[תאגיד|גוף מסחרי]] יחיד. על כך השיבה גוגל שאין דבר המונע מכל גוף שהוא לערוך פרויקט דומה לשלה.
 
בין האתרים המציעים או הציעו שירות דומה:
שורה 51:
*[[מיקרוסופט]] החלה בפרויקט דומה בשם "לייב סרצ' בוקס" (Live Search Books) שהושק בסוף 2006. השירות פעל עד לנטישתו במאי 2008.{{כ}}{{הערה|1={{cite news |first= |last= |authorlink= |coauthors= |title=Microsoft starts online library in challenge to Google Books |url=http://www.theage.com.au/news/biztech/microsoft-starts-online-library-in-challenge-to-google-books/2006/12/07/1165081127665.html|work=AFP |date= 2006-12-08|accessdate=2008-11-24 | location=Melbourne}}}} לאתר נסרקו 750.000 ספרים ו-80,000,000 כתבות עיתונות. כל הספרים שהועלו לאתר זמינים בארכיון האינטרנט, שהוא [[ארגון ללא כוונת רווח]], והפרויקט השני בגודלו אחרי גוגל בתחום סריקת הספרים. נכון לאוקטובר 2010, האתר מכיל יותר מ-2.5 מיליון ספרים סרוקים. חברת קירטאס (Kirtas) טכנולוגיות הייתה ספקית הדיגיטציה הגדולה ביותר שנבחרה על ידי מיקרוסופט עבור הפרויקט Live Search. בחודש יוני 2009 השיקה החברה את האתר KirtasBooks.com, שמכיל כמיליון כותרים מספריות המשתתפות בפרויקט כדי לספק הדפסה באיכות גבוהה והורדה דיגיטלית.
*אתר [http://en.wikipedia.org/wiki/Gallica גאליקה] של [[הספרייה הלאומית של צרפת]] מקשר לכ-800,000 [[ספר דיגיטלי|ספרים דיגיטליים]], עיתונים, כתבי יד, מפות וציורים, וכו'. הספרייה הדיגיטלית מוסיפה להתרחב מאז שנת היווסדה ב-1997, בקצב של כ-5000 מסמכים חדשים לחודש. חלק הארי מהמסמכים הסרוקים, הכתובים רובם ב[[צרפתית]], זמינים לעיון בפורמט של תמונה וטקסט מאז סוף 2008.
*[http://en.wikipedia.org/wiki/HathiTrust HathiTrust] מחזיקה את הספרייה הדיגיטלית HathiTrust מאז 13 אוקטובר 2008,{{הערה|1=[http://www.languagehat.com/archives/003251.php Languagehat.com]}}, המשמרת ומספקת גישה לחומר שנסרק על ידי גוגל, ארכיון האינטרנט, וארגונים מקומיים על ידי מוסדות משותפים. נכון למאי 2010, הספרייה כוללת כ-6 מיליון כרכים, למעלה מ-1 מיליון מתוכם נמצאים ברשות הציבור.
 
==ציוני דרך משמעותיים==
שורה 96:
בתעשיית ההוצאה לאור ובאיגודי [[סופר]]ים מתחו ביקורת על הכללת גזירי טקסט של יצירות מוגנות בזכויות יוצרים, וראו בכך הפרת זכויות. איגוד המו"לים האמריקאי ו[[גילדה|גילדת]] הסופרים (כל אחד בנפרד) תבעו בסוף שנת 2005 את גוגל על "הפרת זכויות יוצרים מסיבית". בתגובה טענה גוגל שהפרויקט הינו המקביל הדיגטלי לכרטסת [[קטלוג|קיטלוג]] מסורתית, והוא מעוגן ב[[שימוש הוגן]], משום שהציטוט המוצג בגזירי הטקסט הוא קצר ודומה באורכו לתוצאות החיפוש שמפנה לאתרים, או לציטוט המופיע בביקורת ספרותית. על אף האמצעים שנקטה גוגל, בכך שסיפקה טקסט מלא רק לספרים הנמצאים ברשות הציבור, תוך הגבלת העיון בספרים מוגנים לקטעי טקסט בני מספר שורות בלבד, המול"ים טענו שאין לגוגל זכות להעתיק ספרים מוגנים שלמים, ולאחסן אותם בכמויות גדולות במסד הנתונים שלה תמורת רווח כספי.
 
לאחר שנתיים וחצי של [[משא ומתן]], גוגל חתמה בשנת 2008 על הסדר עם תעשיית המולי"ם ואיגוד הסופרים בארצות הברית, בו היא הסכימה לשלם סך של 125,000,000 דולר לבעלי הזכויות של הספרים שסרקה. גוגל התחייבה לכסות את הוצאות המשפט, ונדרשה ליצור פנקס רישום של בעלי הזכויות. עם זאת, הסדר הפשרה לא אושר לאחר ש[[משרד המשפטים האמריקאי]] סבר שההסכם מפר את חוק ה[[הגבלים עסקיים|הגבלים העסקיים]]. לאחר דיונים משפטיים שארכו 13 חודשים, דחה שופט פדרלי את ההסדר בנימוק שהוא העניק לגוגל [[מונופול]], הפר חוקי זכויות יוצרים וחוק ההגבלים העסקיים, ואפשר לגוגל להרוויח מספרים ללא השגת רשות מיוצריהם.{{הערה|מיה סלע, [http://www.haaretz.co.il/hasite/spages/1222404.html העתיד המעורפל של גוגל ספרים], באתר [[הארץ]], 27 במרץ 2011}}.
 
בנוסף, ההסדר עורר התנגדות בקרב מספר ארגונים אמריקאיים שלא היו חלק מהתביעה וההסדר, ביניהם ארגון הסופרים והעיתונאים האמריקאי ואיגוד ה[[אמנות חזותית|אמנים החזותיים]], שמתחו ביקורת גורפת על ההסדר והגישו תביעות נוספות. ספריית הווארד התריעה בעקבות ההסדר שתיסוג מהפרויקט אם גוגל לא תחדל לסרוק ספרים מוגנים.
 
שורה 104:
בשנת 2009 נקנסה גוגל בסך 300,000 € על ידי בית משפט אזרחי ב[[פריז]], שהורה לגוגל לשלם 10,000 € ליום עד להסרת ספרי המו"ל התובע ממסד הנתונים שלה. בית המשפט כתב כי "גוגל הפרה את זכויות היוצרים של המחברים בכך שסרקה ואפשרה גישה לספרים שבבעלות המו"ל ללא אישורה" גוגל ערערה על הפסק בערכאה גבוהה יותר. הסופרת הסינית מיאן מיאן הגישה באותה שנה תביעה אזרחית נגד גוגל על סך 8,900 $, בגין סריקת ה[[רומן]] שלה "אוהבי חומצה". זוהי התביעה הראשונה נגד גוגל ב[[סין]].
 
גוגל הגיבה לביקורת המתמשכת בציינה שסריקת הספרים ואחסונם באינטרנט מגנה על המורשת התרבותית של העולם; סרגיי ברין, אחד ממייסדי גוגל אמר כי "[[ספריית אלכסנדריה|הספרייה המפורסמת]] של [[אלכסנדריה]] [[שריפה|נשרפה]] שלוש פעמים, בשנת 48 לפנה"ס, 273 לספירה ו-640 לספירה, כמו גם [[ספריית הקונגרס]], שם החריבה האש בשנת 1851 שני שלישים מהארכיון. אני מקווה שלא יקרה שוב הרס כזה, אולם ההיסטוריה מצביעה אחרת".{{הערה|1=[http://news.bbc.co.uk/2/hi/technology/8298674.stm BBC: Google hits back at book critics], BBC, 9 October 2009}}.
 
מומחים למשפט בארצות הברית טענו כי הפרויקט מסכן את [[דוקטרינה|דוקטרינת]] השימוש הוגן, כיוון שבפרויקט נעשה שימוש בטענת השימוש הוגן בממדים כה אדירים שהוא עלול לגרום להגבלה משפטית של זכות זו. מאחר שאיגוד המולי"ם הגיעה בסוף להסדר עם גוגל, המחלוקת על הגבלות השימוש הוגן נותרה בינתיים בלתי פתורה.
 
==ביקורת על השירות==
מספר גופים הצביעו על בעיות איכות שהתגלו בסריקות ובתהליך ההמרה לטקסט. ה[[מגזין]] [[דר שפיגל]] מבקר תכופות את החוסר ב[[Metadata|מטה-דטה]] ואת איכות הסריקה - שלמרות שנעשית בתהליך ידני התגלו בה טעויות גדולות, כמו כיתוב שגוי של שמות מחברים או שמות ההוצאה לאור, דפים חסרים מתוך הספר או דפים בלתי קריאים.{{הערה|1=Malte Herwig: ''Die entleibte Bibliothek''. In: Der Spiegel, 12/2007, S. 186 f.}}. ממחקר שנערך על ידי [[פרופסור]] בבית הספר ל[[מידענות|מידע]] ב[[אוניברסיטת ברקלי]] בשנת 2007, עולה ש"איכות הסריקה (ובעקבותיה איכות החיפוש) היא לעתים לקויה ביותר. הגרסאות המוצגות הן, במקרה הטוב, מאכזבות".{{הערה|[http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/1972/1847 Inheritance and loss? A brief survey of Google Books] by Paul Duguid,}}. כמו כן נמצאו בעיות של קיטלוג שגוי בגרסה העברית של האתר.{{הערה|אורי ברייטמן, [http://freedomofsearch.blogspot.com/2010/08/blog-post.html גוגל ספרים בעברית - בעיות קיטלוג], בבלוג חופש החיפוש}}.
==קישורים חיצוניים==
{{ויקישיתוף בשורה}}
* [http://books.google.co.il/ האתר]
 
==הערות שוליים==