שיחה:שימוש לרעה בניתוח נתונים

שינוי שם משימוש לרעה בניתוח נתונים לp-hacking

עריכה

{שינוי שם עם זמן|זמן=12.07.2024} השם הנוכחי שימוש לרעה בניתוח נתונים אינו מתאים מהסיבות הבאות

  1. הוא כללי מדי
  2. הוא לא בשימוש
  3. הוא לא מהווה תרגום מוצלח של המושגים באנגלית: Data dredging (also known as data snooping or p-hacking)

אני מציעה להחליף את השם, אבל לא בטוחה מה החלופה הכי טובה. נראה לי שהמושג שנמצא הכי הרבה בשימוש הוא p-hacking וכדאי להשאיר אותו באנגלית עד שיהיה תרגום מקובל שלו. ראו לדוגמא בכתבה של דה מרקר, בסילבוס של האוניברסיטה העברית ובכתבה באתר מדע גדול בקטנה. SigTifשיחה 21:45, 12 ביולי 2024 (IDT)תגובה

@יוסי לוי? SigTifשיחה 19:25, 17 ביולי 2024 (IDT)תגובה
  נגד אנגלות באופן עקרוני. מציע כחלופה את ניתוח/פילוח נתונים מטעה. בברכה, לבלוב📜 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)תגובה
SigTif תיוג בברכה, לבלוב📜 🎗 • י"ז בתמוז ה'תשפ"ד 00:04, 23 ביולי 2024 (IDT)תגובה
השם מאד כללי ולא אומר כלום. הצעה: "יצירת מובהקות סטטיסטית כוזבת במחקרים". ‏ La Nave🎗 07:17, 23 ביולי 2024 (IDT)תגובה
הפתרון פשוט: לשלב את הערך הזה כפסקה בערך כריית נתונים. זה יפתור מספר בעיות: את זה שאין מונח בעברית, את הכותרת השיפוטית והלא-נייטרלית לחלוטין (כי בויקיפדיה מי שמחליט מתי זה שימוש לרעה זה הקוראים, לא הכותבים), וגם את זה שעל כל צעד ושעל ניתן למצוא "שימושים לרעה" ולא הגיוני לכתוב ערכים נפרדים על שימושים שונים באותה תופעה - לא נכתוב את שימוש לרעה בזוגיות, שימוש לרעה באנרגיה אטומית, שימוש לרעה באונר"א וכיוצ"ב. הכל צריך להיות חלק מהערך העיקרי. עמית - שיחה 07:58, 23 ביולי 2024 (IDT)תגובה
הנושא הוא לא כריית נתונים אלא שטיקים סטטיסטיים כדי להוכיח מה שרוצים, בעצם. כשיש דטה בייס גדול זה יותר קל, אבל אני לא חושבת שזה הנושא. ‏ La Nave🎗 14:40, 23 ביולי 2024 (IDT)תגובה
כמו שאת מציגה את זה, זה צריך להיות פסקה בערך הונאה. העניין כאן זה שלא מדובר במושג העומד בפני עצמו: מדובר כאן על שיטה שהיא תוצר לוואי של פעולה אחרת כלשהי. עמית - שיחה 16:08, 23 ביולי 2024 (IDT)תגובה
כמובן זו הונאה, לכן קוראים לזה p Hacking. זו הונאה מדעית. ‏ La Nave🎗 16:13, 23 ביולי 2024 (IDT)תגובה
@עמית אבידן, בניגוד למה שמשתמע מהשם הכללי "שימוש לרעה בניתוח נתונים", מדובר על תופעה ספציפית וחשובה, צעדים סטטיסטיים מסויימים שאפשר לעשות כדי להטות את הממצאים. אני לא חושבת שצריך לאחד את התוכן הזה לתוך ערך אחר, אבל צריך למצוא לו שם מדוייק יותר שיצביע על האופי הייחודי שלו. SigTifשיחה 17:36, 23 ביולי 2024 (IDT)תגובה
על איזה בסיס את טוענת שמדובר בשיטת הונאה במחקר שיש לה חשיבות רבה יותר מלכל שיטה אחרת? עמית - שיחה 17:38, 23 ביולי 2024 (IDT)תגובה
אני לא יודעת מה החשיבות של זה לעומת שיטה אחרת. ‏ La Nave🎗 19:55, 23 ביולי 2024 (IDT)תגובה
ראשית, לא מדוייק לקרוא לזה הונאה, זו יותר הטיה, כשל או דפוס פעולה שגוי, למרות שהיא יכולה לגבול בהונאה. בוויקיעברית תרגמו את המושג scientific misconduct להונאה במחקר (גם בערך וגם בקטגוריה), אבל זה לא תרגום מדוייק. מתאים יותר לתרגם misconduct ל"התנהגות בלתי הולמת". p-hacking לא מופיע בערך הונאה במחקר, ולא במקרה. זה דומה יותר לערכים כמו קטיף דובדבנים - התנהגויות שאינן תקינות אבל לא נחשבות להונאה. לגבי החשיבות, מדובר בתופעה רחבה בעלת השלכות משמעותיות, שמוכרת גם מחוץ לאקדמיה. SigTifשיחה 21:18, 23 ביולי 2024 (IDT)תגובה
אנחנו בדיון שינוי שם, לא חשיבות. העובדה הכי חשובה היא שאין מונח כזה בעברית. אני מנסה לנטרל את המוקש הזה על ידי שילוב המידע בערך המתאים ביותר כי ממילא מדובר בלא יותר מקצרמר (לא חס וחלילה מחיקת המידע). אם מתעקשים על השארת הפיסקה הזאת כערך עצמאי, כל שם מלבד p-hacking יהיה מחקר מקורי, עד שהאקדמיה תבוא ותחליט. עמית - שיחה 22:20, 23 ביולי 2024 (IDT)תגובה
אין לי התנגדות ל p-hacking. ‏ La Nave🎗 03:27, 24 ביולי 2024 (IDT)תגובה
נימוקיו והצעתו של עמית אבידן משכנעים.
בעד איחוד. מקצועישיחה 15:28, 29 ביולי 2024 (IDT)תגובה
עד כה לא הוצגה פורמלית הצעה לאיחוד באמצעות {{איחוד}} בברכה, לבלוב📜 🎗 • כ"ג בתמוז ה'תשפ"ד 15:32, 29 ביולי 2024 (IDT)תגובה
נגד איחוד. מדובר על נושאים שונים. מציעה למצות את הדיון בנוגע לשינוי השם קודם. @לבלוב, תוכל לשקול שוב את השם p-hacking עד שיהיה שם מקובל בעברית? השם הנוכחי אינו טוב, וכל שם אחר שניתן בעברית יהיה המצאה חדשנית שלנו. SigTifשיחה 17:28, 29 ביולי 2024 (IDT)תגובה

בשל הצעת האיחוד הרשומה מטה, אני מסירה את ההצעה לשינוי שם. SigTifשיחה 13:42, 10 באוגוסט 2024 (IDT)תגובה

איחוד עם הערך ערך-p

עריכה

{איחוד|שימוש לרעה בניתוח נתונים|ערך-p} הערך הזה קצרצר, כמעט אין בו מידע, מה שיש בו נמצא בערך ערך-p, והוא יחליק בקלות לתוך פרק הביקורת שכבר מזכיר את המושג P-HACKING. ‏ La Nave🎗 17:35, 30 ביולי 2024 (IDT)תגובה

נשמע טוב. SigTifשיחה 17:53, 30 ביולי 2024 (IDT)תגובה
לא הוצגה התנגדות, אני מאחדת את הטקסט הנמצא כאן לתוך הערך ערך-p. SigTifשיחה 13:41, 10 באוגוסט 2024 (IDT)תגובה
חזרה לדף "שימוש לרעה בניתוח נתונים".