שיחה:שימוש לרעה בניתוח נתונים
תגובה אחרונה: לפני 29 ימים מאת SigTif בנושא שינוי שם משימוש לרעה בניתוח נתונים לp-hacking
שינוי שם משימוש לרעה בניתוח נתונים לp-hacking
עריכה{שינוי שם עם זמן|זמן=12.07.2024} השם הנוכחי שימוש לרעה בניתוח נתונים אינו מתאים מהסיבות הבאות
- הוא כללי מדי
- הוא לא בשימוש
- הוא לא מהווה תרגום מוצלח של המושגים באנגלית: Data dredging (also known as data snooping or p-hacking)
אני מציעה להחליף את השם, אבל לא בטוחה מה החלופה הכי טובה. נראה לי שהמושג שנמצא הכי הרבה בשימוש הוא p-hacking וכדאי להשאיר אותו באנגלית עד שיהיה תרגום מקובל שלו. ראו לדוגמא בכתבה של דה מרקר, בסילבוס של האוניברסיטה העברית ובכתבה באתר מדע גדול בקטנה. SigTif • שיחה 21:45, 12 ביולי 2024 (IDT)
- @יוסי לוי? SigTif • שיחה 19:25, 17 ביולי 2024 (IDT)
- נגד אנגלות באופן עקרוני. מציע כחלופה את ניתוח/פילוח נתונים מטעה. בברכה, לבלוב • 📜 • 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)
- SigTif תיוג בברכה, לבלוב • 📜 • 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)
- השם מאד כללי ולא אומר כלום. הצעה: "יצירת מובהקות סטטיסטית כוזבת במחקרים". La Nave 🎗 07:17, 23 ביולי 2024 (IDT)
- הפתרון פשוט: לשלב את הערך הזה כפסקה בערך כריית נתונים. זה יפתור מספר בעיות: את זה שאין מונח בעברית, את הכותרת השיפוטית והלא-נייטרלית לחלוטין (כי בויקיפדיה מי שמחליט מתי זה שימוש לרעה זה הקוראים, לא הכותבים), וגם את זה שעל כל צעד ושעל ניתן למצוא "שימושים לרעה" ולא הגיוני לכתוב ערכים נפרדים על שימושים שונים באותה תופעה - לא נכתוב את שימוש לרעה בזוגיות, שימוש לרעה באנרגיה אטומית, שימוש לרעה באונר"א וכיוצ"ב. הכל צריך להיות חלק מהערך העיקרי. עמית - שיחה 07:58, 23 ביולי 2024 (IDT)
- הנושא הוא לא כריית נתונים אלא שטיקים סטטיסטיים כדי להוכיח מה שרוצים, בעצם. כשיש דטה בייס גדול זה יותר קל, אבל אני לא חושבת שזה הנושא. La Nave 🎗 14:40, 23 ביולי 2024 (IDT)
- כמו שאת מציגה את זה, זה צריך להיות פסקה בערך הונאה. העניין כאן זה שלא מדובר במושג העומד בפני עצמו: מדובר כאן על שיטה שהיא תוצר לוואי של פעולה אחרת כלשהי. עמית - שיחה 16:08, 23 ביולי 2024 (IDT)
- כמובן זו הונאה, לכן קוראים לזה p Hacking. זו הונאה מדעית. La Nave 🎗 16:13, 23 ביולי 2024 (IDT)
- @עמית אבידן, בניגוד למה שמשתמע מהשם הכללי "שימוש לרעה בניתוח נתונים", מדובר על תופעה ספציפית וחשובה, צעדים סטטיסטיים מסויימים שאפשר לעשות כדי להטות את הממצאים. אני לא חושבת שצריך לאחד את התוכן הזה לתוך ערך אחר, אבל צריך למצוא לו שם מדוייק יותר שיצביע על האופי הייחודי שלו. SigTif • שיחה 17:36, 23 ביולי 2024 (IDT)
- על איזה בסיס את טוענת שמדובר בשיטת הונאה במחקר שיש לה חשיבות רבה יותר מלכל שיטה אחרת? עמית - שיחה 17:38, 23 ביולי 2024 (IDT)
- אני לא יודעת מה החשיבות של זה לעומת שיטה אחרת. La Nave 🎗 19:55, 23 ביולי 2024 (IDT)
- ראשית, לא מדוייק לקרוא לזה הונאה, זו יותר הטיה, כשל או דפוס פעולה שגוי, למרות שהיא יכולה לגבול בהונאה. בוויקיעברית תרגמו את המושג scientific misconduct להונאה במחקר (גם בערך וגם בקטגוריה), אבל זה לא תרגום מדוייק. מתאים יותר לתרגם misconduct ל"התנהגות בלתי הולמת". p-hacking לא מופיע בערך הונאה במחקר, ולא במקרה. זה דומה יותר לערכים כמו קטיף דובדבנים - התנהגויות שאינן תקינות אבל לא נחשבות להונאה. לגבי החשיבות, מדובר בתופעה רחבה בעלת השלכות משמעותיות, שמוכרת גם מחוץ לאקדמיה. SigTif • שיחה 21:18, 23 ביולי 2024 (IDT)
- אנחנו בדיון שינוי שם, לא חשיבות. העובדה הכי חשובה היא שאין מונח כזה בעברית. אני מנסה לנטרל את המוקש הזה על ידי שילוב המידע בערך המתאים ביותר כי ממילא מדובר בלא יותר מקצרמר (לא חס וחלילה מחיקת המידע). אם מתעקשים על השארת הפיסקה הזאת כערך עצמאי, כל שם מלבד p-hacking יהיה מחקר מקורי, עד שהאקדמיה תבוא ותחליט. עמית - שיחה 22:20, 23 ביולי 2024 (IDT)
- אין לי התנגדות ל p-hacking. La Nave 🎗 03:27, 24 ביולי 2024 (IDT)
- נימוקיו והצעתו של עמית אבידן משכנעים.
- בעד איחוד. מקצועי • שיחה 15:28, 29 ביולי 2024 (IDT)
- עד כה לא הוצגה פורמלית הצעה לאיחוד באמצעות {{איחוד}} בברכה, לבלוב • 📜 • 🎗 • כ"ג בתמוז ה'תשפ"ד 15:32, 29 ביולי 2024 (IDT)
- נגד איחוד. מדובר על נושאים שונים. מציעה למצות את הדיון בנוגע לשינוי השם קודם. @לבלוב, תוכל לשקול שוב את השם p-hacking עד שיהיה שם מקובל בעברית? השם הנוכחי אינו טוב, וכל שם אחר שניתן בעברית יהיה המצאה חדשנית שלנו. SigTif • שיחה 17:28, 29 ביולי 2024 (IDT)
- עד כה לא הוצגה פורמלית הצעה לאיחוד באמצעות {{איחוד}} בברכה, לבלוב • 📜 • 🎗 • כ"ג בתמוז ה'תשפ"ד 15:32, 29 ביולי 2024 (IDT)
- אין לי התנגדות ל p-hacking. La Nave 🎗 03:27, 24 ביולי 2024 (IDT)
- אנחנו בדיון שינוי שם, לא חשיבות. העובדה הכי חשובה היא שאין מונח כזה בעברית. אני מנסה לנטרל את המוקש הזה על ידי שילוב המידע בערך המתאים ביותר כי ממילא מדובר בלא יותר מקצרמר (לא חס וחלילה מחיקת המידע). אם מתעקשים על השארת הפיסקה הזאת כערך עצמאי, כל שם מלבד p-hacking יהיה מחקר מקורי, עד שהאקדמיה תבוא ותחליט. עמית - שיחה 22:20, 23 ביולי 2024 (IDT)
- ראשית, לא מדוייק לקרוא לזה הונאה, זו יותר הטיה, כשל או דפוס פעולה שגוי, למרות שהיא יכולה לגבול בהונאה. בוויקיעברית תרגמו את המושג scientific misconduct להונאה במחקר (גם בערך וגם בקטגוריה), אבל זה לא תרגום מדוייק. מתאים יותר לתרגם misconduct ל"התנהגות בלתי הולמת". p-hacking לא מופיע בערך הונאה במחקר, ולא במקרה. זה דומה יותר לערכים כמו קטיף דובדבנים - התנהגויות שאינן תקינות אבל לא נחשבות להונאה. לגבי החשיבות, מדובר בתופעה רחבה בעלת השלכות משמעותיות, שמוכרת גם מחוץ לאקדמיה. SigTif • שיחה 21:18, 23 ביולי 2024 (IDT)
- אני לא יודעת מה החשיבות של זה לעומת שיטה אחרת. La Nave 🎗 19:55, 23 ביולי 2024 (IDT)
- על איזה בסיס את טוענת שמדובר בשיטת הונאה במחקר שיש לה חשיבות רבה יותר מלכל שיטה אחרת? עמית - שיחה 17:38, 23 ביולי 2024 (IDT)
- @עמית אבידן, בניגוד למה שמשתמע מהשם הכללי "שימוש לרעה בניתוח נתונים", מדובר על תופעה ספציפית וחשובה, צעדים סטטיסטיים מסויימים שאפשר לעשות כדי להטות את הממצאים. אני לא חושבת שצריך לאחד את התוכן הזה לתוך ערך אחר, אבל צריך למצוא לו שם מדוייק יותר שיצביע על האופי הייחודי שלו. SigTif • שיחה 17:36, 23 ביולי 2024 (IDT)
- כמובן זו הונאה, לכן קוראים לזה p Hacking. זו הונאה מדעית. La Nave 🎗 16:13, 23 ביולי 2024 (IDT)
- כמו שאת מציגה את זה, זה צריך להיות פסקה בערך הונאה. העניין כאן זה שלא מדובר במושג העומד בפני עצמו: מדובר כאן על שיטה שהיא תוצר לוואי של פעולה אחרת כלשהי. עמית - שיחה 16:08, 23 ביולי 2024 (IDT)
- הנושא הוא לא כריית נתונים אלא שטיקים סטטיסטיים כדי להוכיח מה שרוצים, בעצם. כשיש דטה בייס גדול זה יותר קל, אבל אני לא חושבת שזה הנושא. La Nave 🎗 14:40, 23 ביולי 2024 (IDT)
- הפתרון פשוט: לשלב את הערך הזה כפסקה בערך כריית נתונים. זה יפתור מספר בעיות: את זה שאין מונח בעברית, את הכותרת השיפוטית והלא-נייטרלית לחלוטין (כי בויקיפדיה מי שמחליט מתי זה שימוש לרעה זה הקוראים, לא הכותבים), וגם את זה שעל כל צעד ושעל ניתן למצוא "שימושים לרעה" ולא הגיוני לכתוב ערכים נפרדים על שימושים שונים באותה תופעה - לא נכתוב את שימוש לרעה בזוגיות, שימוש לרעה באנרגיה אטומית, שימוש לרעה באונר"א וכיוצ"ב. הכל צריך להיות חלק מהערך העיקרי. עמית - שיחה 07:58, 23 ביולי 2024 (IDT)
- השם מאד כללי ולא אומר כלום. הצעה: "יצירת מובהקות סטטיסטית כוזבת במחקרים". La Nave 🎗 07:17, 23 ביולי 2024 (IDT)
- SigTif תיוג בברכה, לבלוב • 📜 • 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)
- נגד אנגלות באופן עקרוני. מציע כחלופה את ניתוח/פילוח נתונים מטעה. בברכה, לבלוב • 📜 • 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)
בשל הצעת האיחוד הרשומה מטה, אני מסירה את ההצעה לשינוי שם. SigTif • שיחה 13:42, 10 באוגוסט 2024 (IDT)
{איחוד|שימוש לרעה בניתוח נתונים|ערך-p} הערך הזה קצרצר, כמעט אין בו מידע, מה שיש בו נמצא בערך ערך-p, והוא יחליק בקלות לתוך פרק הביקורת שכבר מזכיר את המושג P-HACKING. La Nave 🎗 17:35, 30 ביולי 2024 (IDT)
- נשמע טוב. SigTif • שיחה 17:53, 30 ביולי 2024 (IDT)
- לא הוצגה התנגדות, אני מאחדת את הטקסט הנמצא כאן לתוך הערך ערך-p. SigTif • שיחה 13:41, 10 באוגוסט 2024 (IDT)