שיחה:חוק זיף

תגובה אחרונה: לפני 5 שנים מאת אילן שמעוני בנושא הכתוב בערך מוגזם וכנראה לא נכון

עיברות של Zipf הינו עם "ז" ולא עם "צ". זיפף ולא ציפף. לפיכך הפניה לערך "ציפף" היא גם מטעה וגם אינה נכונה. בנוסף, חוק Zipf מוכר בלועזית בלבד, גם באקדמיה הישראלית. עיברות מאולץ אינו תורם ליכולת המחפשים למצוא את הערך. אני מציע להסיר את ההפניה התמוהה הזו ולהשאיר את הערך המקורי, דהיינו חוק Zipf בתודה - Dr Eli Rohn - שיחה 14:08, 9 ביוני 2009 (IDT)תגובה

השם הגרמני Zipf נהגה בגרמנית ציפף. על כך אין שום ויכוח. אלא שבגלל היותו אמריקאי נהגה שמו zɪf (בכתיב IPA), דהיינו זיף, והגרמנים אף טרחו לציין את זה בערך בגרמנית עליו (de:George Kingsley Zipf) בדיוק בגלל הבלבול האפשרי הזה. לפיכך העברתי לזיף. ‏Harel‏ • שיחה 23:24, 9 ביוני 2009 (IDT)תגובה

אם כך, הראל, למה זיף ולא זיפף?

מה שהערך הזה באמת צריך הוא שכתוב ולא ויכוח על שם הערך. תומר א. - שיחה 18:59, 23 ביוני 2009 (IDT)תגובה
על מה ולמה שכתוב? אילן שמעוני - שיחה 23:39, 25 בפברואר 2011 (IST)תגובה
בין אם לכך התכוון תומר ובין אם לאו, לפחות דבר אחד אני יכול לומר: ההסבר:


- שכיחות מילה מסוימת בטקסט X.
P1- שכיחות המילה בעלת התדירות הגבוהה ביותר בטקסט X.
r- דירוג המילה (rank) בטקסט X.
סתום לגמרי עד שמישהו יבאר מה זה דירוג (rank).
קיפודנחש - שיחה 18:51, 26 בפברואר 2011 (IST)תגובה
קודם כל, קצת קשה לזכור למה כתבתי לפני שנה וחצי שהערך דורש שכתוב. יש לי הרגשה שהערך הזה תורגם מאנגלית בלי שהמתרגם יבין מה כתוב בו. לגבי מה שהקיפודנחש אמר, הנוסחה מתארת יחס; אני חושב ש-Rank משמעו מספר ההופעות (יעני, שכיחות). למרבה ההפתעה לא מצאתי בכלל את הנוסחה הזאת באנגלית. בעיקר, לאחר קריאת הערך הזה אני לא מרגיש יותר חכם ממה שהייתי כשנכנסתי לפה. תומר א. - שיחה - משנה ויקיפדית02:26, 27 בפברואר 2011 (IST)תגובה
אה, את זה אני יכול לבאר- זהו מספר טבעי שהוא דירוג המילה r ברשימה ממוינת על פי סדר השכיחות, מגבוה לנמוך. חוק זיף מנבא שבכל שפה טבעית הגרף המתקבל יהיה קו ישר, וזו הגדרה חזקה הרבה יותר מסתם פונקציה מונוטונית יורדת, שהיא התוצאה שתתקבל בכל מקרה. אילן שמעוני - שיחה 11:23, 27 בפברואר 2011 (IST)תגובה
לפי הערך באנגלית ההתפלגות תהיה קו ישר רק על סקלת לוג-לוג, לא שזה הופך את המסקנה לפחות מעניינת אלא שאין אף מילה על זה בערך. בנוסף, לפי מה שהסברת כאן הערך אינו השכיחות של מילה מסוימת בטקסט אלא כפי שאמרתי, יחס. תומר א. - שיחה - משנה ויקיפדית11:56, 27 בפברואר 2011 (IST)תגובה
אגב, עכשיו אני רואה שמאז שכתבתי שהערך דורש עריכה עברו עליו כמה ויקיפדים וערכו אותו. תומר א. - שיחה - משנה ויקיפדית14:47, 27 בפברואר 2011 (IST)תגובה
אבל למה לבאר בדף השיחה? לא עדיף לבאר בערך עצמו? בכבוד - קיפודנחש - שיחה 14:26, 27 בפברואר 2011 (IST)תגובה

קיצוץ מסיבי עריכה

ביצעתי עריכה מסיבית בערך, והסרתי קטעים שהקשר שלהם לערך אינו ברור, כמו דיון באלגוריתמים של מנועי חיפוש, טכניקות של caching וכדומה. אם לדעתכם הקיצוץ אינו מוצדק, אנא נמקו בדף השיחה מדוע מידע זה קשור לחוק זיף. קיפודנחש - שיחה 16:16, 5 במרץ 2011 (IST)תגובה


קישור שבור עריכה

במהלך מספר ריצות אוטומטיות של הבוט, נמצא שהקישור החיצוני הבא אינו זמין. אנא בדקו אם הקישור אכן שבור, ותקנו אותו או הסירו אותו במקרה זה!

--Matanyabot - שיחה 09:42, 17 ביוני 2013 (IDT)תגובה

הכתוב בערך מוגזם וכנראה לא נכון עריכה

"כך, לפי חוק זיף, המילה הנפוצה ביותר תופיע בטקסט כפליים מהמילה השנייה (כלומר בעלת דירוג 2), פי שלושה יותר מהמילה השלישית בתפוצתה וכן הלאה.". כלומר בספר ממוצע, המילה הכי שכיחה מופיעה פי שתיים מהמילה השניה הכי שכיחה? ופי 3 מהמילה השלישית? ופי 10 מהמילה העשירית (וכן הלאה)? נשמע מוגזם מדי. אולי צריך לשים איזה אזהרה או פשוט לתקן. רן כהןשיחה 19:21, 3 ביוני 2016 (IDT)תגובה

איננני יודע לגבי "נשמע", אבל חוק זיף נחקר חקירה יסודית על ידי לא מעט חוקרים, ואלה התוצאות. אם ידוע לך על מחקר שסותר תוצאות אלה, המחקר שעבר ביקורת עמיתים ופורסם, אז ההסתייגות שציינת ראןיה להכלל בערך. אילן שמעוני - שיחה 16:55, 14 ביולי 2018 (IDT)תגובה
חזרה לדף "חוק זיף".