שיחת תבנית:אתר רשמי/הסרת לא פעילים

תגובה אחרונה: לפני שנה מאת Kotz בנושא דיון
בוט ההסבה

ראו גם:

מבוא

ראו ויקיפדיה:דלפק ייעוץ#מניעת שאיבת קישור לאתר רשמי בורה בורה - שיחה 19:49, 7 בספטמבר 2022 (IDT)תגובה

אישורים

דיון

משתמש:עלי תוכל להציץ במפרט הקצרצר הזה בבחינת "אורח לרגע רואה כל פגע"...

  • ההצבה לפני הקריאה לדף האינטרנט נכונה, בדקתי את זה. אבל כשאני מוסיף את שתי השורות האחרונות שבודקות אם האתר "חי" כדי לדלג על אתרים פעילים, הוא נתקע! למה? זו אותה פקודה בדיוק שעובדת המפרט ההוספה.
  • ניסיתי להסיר את את {{אתר רשמי}} "בצורה נקייה" על ידי ביטוי רגולרי אבל משום מה זה לא עובד. גם כאן, זה ביטוי שעבד. מצאתי תחליף עם אבל זה פחות נקי כי משאיר שורה רווח.
  • תודה. בורה בורה - שיחה 05:54, 8 בספטמבר 2022 (IDT)תגובה

משתמש:Kotz תוכל אתה להסתכל? בורה בורה - שיחה 09:54, 25 בדצמבר 2022 (IST)תגובה

משתמש:Kotz ראה את הדף הראשון ...Baby One More Time. זה אתר פעיל וכשר. למה הוא מדווח אותו כשגיאה? בורה בורה - שיחה 13:36, 26 בדצמבר 2022 (IST)תגובה
מש:בורה בורה אני מסכים איתך שמשהוו מוזר כאן. לא הצלחתי לפתור את זה. מעניין אם יש עוד דפים כאלו ‏«kotz» «שיחה» 00:10, 30 בדצמבר 2022 (IST) מש:בורה בורה ‏«kotz» «שיחה» 09:40, 30 בדצמבר 2022 (IST)תגובה
משתמש:Kotz לא עשיתי כלום חוץ מלהגדיל את הכמות ל-50. והנה זה הכניס אותו ללולאה אין סופית... תוכל לבדוק. בורה בורה - שיחה 18:48, 1 בינואר 2023 (IST)תגובה
מש:בורה בורה. הבעייה היתה בדף .irish . בתבנית מופיעה כתובת URL ללא https ולכן הבטוט אינ מצליח לגלוש שמה. זה גרם לבוט ליפול בצורה לא מכובדת כלל, ואת זה תיקנתי. עכשיו כתובת מהצורה הזו פשוט תחזיר תוכן אתר ריק, כמו שגיאות אחרות. ‏«kotz» «שיחה» 14:17, 2 בינואר 2023 (IST)תגובה

משתמש:Kotz עברתי על 40 הערכים הראשונים מהרשימה. האתרים הבאים נראים בהחלט כשרים. יכול להיות שבכמה הקישור היה צריך להוביל לדף משנה מסוים, ואם הוא לא קיים, אוטומטית עוברים לדף הראשי בלי לידע את המשתמש. זה מחווה לך שגיאה? אבל יש כאלה כמו האתר של 3M ועוד שהם כשרים לחלוטין. למה חוזרת שגיאה? בורה בורה - שיחה 16:52, 2 בינואר 2023 (IST)תגובה

מש:בורה בורה אני לא יודע בדיוק; ככל הנראה יש כאן מגוון של בעיות. לדוגמא הדף ב24 (סדרת טלוויזיה) שהוא [1] . אם תנסה להיכנס אליו בעזרת כלי כמו curl תקבל שגיאה. אם אני מנסה להיכנס אליו ובעזרת דפדפן chrome תוך שימוש ב devTools אני רואה גם שגיאה מסוג 404 אבל בכל זאת מוצג מידע לגבי הסדרה. ככה שבסה"כ אני לא מכיר שיש לנו פתרון מוצלח. ‏«kotz» «שיחה» 12:14, 3 בינואר 2023 (IST)תגובה
משתמש:Kotz באתר 3M.COM אני לא רואה בעיה ב-כרום או MS-EDGE. מה אתה רואה שם עם כלים כמו curl? מה עם דפדפן chrome תוך שימוש ב devTools? כשהבוט מבצע קריאה באיזה כלי הוא משתמש ולמה זה מקביל? בורה בורה - שיחה 13:32, 3 בינואר 2023 (IST)תגובה
מש:בורה בורה - כפי שכתוב במורד הדף, יש שם איזה TIMEOUT. נראה לי שהאתר חוסם את הבוט בגלל שה-User Agent כולל את המילה Bot. הרץ את הפקודה הבאה
wget -U Bot https://www.3m.com/
היא נכשלת עם timeout . החלף Bot ל-Boat והיא אינה נכשלת.
אתה יכול גם לשנות את ה user agent תוך שימוש ב chrome devTools, וגם אז רואים את אותה התנהגות
הקוד של הבוט משתמש בUser Agent שכולל את כתובת דף השיחה של משתמש:KotzBot
נראה לי שעלינו לקבל בהכנעה את חוסר רצונו של האתר שיבקרו אותו בוטים.
‏«kotz» «שיחה» 20:28, 3 בינואר 2023 (IST)תגובה

תבנית להסבה

תבנית:אתר רשמי

ערכים להסבה מושהה

בנימין נתניהו לוק מאבלי סאבוולפר

מרחבי שם

+מרחב הערכים

ביטוי רגולרי להסבה מושהה

(?imx) ^ [ *]* \{\{ [ ]* ( אתר[ ]*רשמי[ ]* ) [| ]* [^}{]* \}\} [ ]* \n

ביטוי רגולרי להסבה

\[\[קטגוריה:[\s\S]*$

מפרט הסבה


<<<יהי $אתר##<<<ויקינתונים:P856>>>>>>...
<<<יהי $ערך##<<<1>>>>>>...
<<<יהי $אתר_לבדיקה##<<<$ערך##החלףר:^$==><<<$אתר>>>>>>>>>...
<<<! $אתר_לבדיקה= <<<$אתר_לבדיקה>>> {{ש}} >>>...
<<<יהי $תוכן_האתר##<<<תוכן דף אינטרנט##<<<$אתר_לבדיקה>>>>>>>>>...
<<<דלג אם יש##<<<$תוכן_האתר>>>>>>...
[[קטגוריה:ערכים שבהם תבנית אתר רשמי אינה מתאימה להוספה אוטומטית]]

תקציר עריכה

הסרת {{אתר רשמי}} אם האתר אינו פעיל

סטטוס

  בוצע יבש 50 עריכות; 276 דולגו במפורש; 275 לא נצפה שינוי, 0 תקלות, 0 ארכיון, 0 לא דפים. @מש:בורה בורהKotzBotדף שיחהתרומות14:55, 2 בינואר 2023 (IST)תגובה

 מתחיל בעבודה, אטפל ב-50 דפים מתוך 58,013. KotzBotדף שיחהתרומות12:20, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב...Baby One More Time: כשלון בקריאת דף אינטרנט https://britneyspears.com, מהסיבה: "The remote server returned an error: (403) Forbidden." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:20, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.af: כשלון בקריאת דף אינטרנט https://www.nic.af/, מהסיבה: "The operation has timed out." "" "Timeout"‏ • KotzBotדף שיחהתרומות12:22, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.al: כשלון בקריאת דף אינטרנט https://www.akep.al/, מהסיבה: "The remote server returned an error: (503) Service Temporarily Unavailable." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:22, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.bf: כשלון בקריאת דף אינטרנט http://www.artel.bf/, מהסיבה: "The operation has timed out." "" "Timeout"‏ • KotzBotדף שיחהתרומות12:24, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.cc: כשלון בקריאת דף אינטרנט https://www.verisign.com/domain-names/cc-domain, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:25, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.et: כשלון בקריאת דף אינטרנט http://www.ethiotelecom.et, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:26, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.gp: כשלון בקריאת דף אינטרנט https://www.dom-enic.com/domaine-gf-gp-mq-sur-dom-enic.html, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:26, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.gu: כשלון בקריאת דף אינטרנט http://gadao.gov.gu/, מהסיבה: "The operation has timed out." "" "Timeout"‏ • KotzBotדף שיחהתרומות12:28, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.irish: כשלון בקריאת דף אינטרנט nic.irish, מהסיבה: "Invalid URI: The format of the URI could not be determined."‏ • KotzBotדף שיחהתרומות12:28, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.kp: כשלון בקריאת דף אינטרנט http://www.star.co.kp/, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:28, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.lgbt: כשלון בקריאת דף אינטרנט www.get.lgbt, מהסיבה: "Invalid URI: The format of the URI could not be determined."‏ • KotzBotדף שיחהתרומות12:29, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.pg: כשלון בקריאת דף אינטרנט http://www.unitech.ac.pg/InformationAbout/Services/ICTS/DomainRegistry, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:30, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.qa: כשלון בקריאת דף אינטרנט http://www.qtel.com.qa/, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:31, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.ru: כשלון בקריאת דף אינטרנט https://cctld.ru, מהסיבה: "The operation has timed out." "" "Timeout"‏ • KotzBotדף שיחהתרומות12:32, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.sa: כשלון בקריאת דף אינטרנט http://www.nic.net.sa/, מהסיבה: "Error: SecureChannelFailure (Authentication failed, see inner exception.)" "" "SecureChannelFailure"‏ • KotzBotדף שיחהתרומות12:32, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.tr: כשלון בקריאת דף אינטרנט https://www.nic.tr, מהסיבה: "Error getting response stream (GetResponse): ServerProtocolViolation" "" "ServerProtocolViolation"‏ • KotzBotדף שיחהתרומות12:33, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.vn: כשלון בקריאת דף אינטרנט http://www.vnnic.vn/, מהסיבה: "Unable to read data from the transport connection: Connection reset by peer." "" "UnknownError"‏ • KotzBotדף שיחהתרומות12:33, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב.հայ: כשלון בקריאת דף אינטרנט https://ինտերնետհանրություն.հայ, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב1 נגד 100: כשלון בקריאת דף אינטרנט http://kro-ncrv.nl/eentegen100, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב10 דברים שאני שונאת אצלך (סדרת טלוויזיה): כשלון בקריאת דף אינטרנט http://freeform.go.com/shows/10-things-i-hate-about-you, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב100 (סדרת טלוויזיה): כשלון בקריאת דף אינטרנט http://www.cwtv.com/shows/the-100, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב100 דברים להספיק לפני התיכון: כשלון בקריאת דף אינטרנט http://www.nick.com/100-things-to-do-before-high-school/, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב11 bit studios: כשלון בקריאת דף אינטרנט www.11bitstudios.com/, מהסיבה: "Invalid URI: The format of the URI could not be determined."‏ • KotzBotדף שיחהתרומות12:34, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב127 שעות: כשלון בקריאת דף אינטרנט http://www.127hoursmovie.com, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:35, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב13 סיבות: כשלון בקריאת דף אינטרנט http://www.thirteenreasonswhy.com, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:35, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב1612 (סרט): כשלון בקריאת דף אינטרנט http://www.1612film.ru, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:35, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב20 מיליון מיל אל כדור הארץ: כשלון בקריאת דף אינטרנט http://www.sonypictures.com/homevideo/20millionmilestoearth, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב22 מייל: כשלון בקריאת דף אינטרנט http://mile22.movie/, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב23 דקות: כשלון בקריאת דף אינטרנט http://www.23tv.co.il/1455-he/23dakot.aspx/1455-he/23dakot.aspx, מהסיבה: "The remote server returned an error: (403) Forbidden." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב24 (סדרת טלוויזיה): כשלון בקריאת דף אינטרנט https://www.fox.com/24/, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב24 שעות עם...: כשלון בקריאת דף אינטרנט http://programma.vpro.nl/24uurmet/, מהסיבה: "Error: NameResolutionFailure" "" "NameResolutionFailure"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב24: גאולה: כשלון בקריאת דף אינטרנט http://www.fox.com/24, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב27 שמלות: כשלון בקריאת דף אינטרנט http://www.27dressesthemovie.com/, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:36, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב2NE1: כשלון בקריאת דף אינטרנט http://www.yg-2ne1.com, מהסיבה: "The remote server returned an error: (520) ." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:37, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב360° (סיבוב הופעות): כשלון בקריאת דף אינטרנט u2.com/tour, מהסיבה: "Invalid URI: The format of the URI could not be determined."‏ • KotzBotדף שיחהתרומות12:37, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב3ds Max: כשלון בקריאת דף אינטרנט https://www.autodesk.com/products/3ds-max/overview, מהסיבה: "The remote server returned an error: (403) Forbidden." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:37, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב3M: כשלון בקריאת דף אינטרנט https://www.3m.com/, מהסיבה: "The operation has timed out." "" "Timeout"‏ • KotzBotדף שיחהתרומות12:39, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב3sat: כשלון בקריאת דף אינטרנט http://www.3sat.de/index.html, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:39, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב470 (מפרשית): כשלון בקריאת דף אינטרנט www.470.org, מהסיבה: "Invalid URI: The format of the URI could not be determined."‏ • KotzBotדף שיחהתרומות12:39, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב4chan: כשלון בקריאת דף אינטרנט https://www.4chan.org/, מהסיבה: "The remote server returned an error: (403) Forbidden." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:39, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב50 התורמים הגדולים ליורוליג: כשלון בקריאת דף אינטרנט http://www.euroleague.net/history/50-years/main, מהסיבה: "Invalid status code: 308" "" "UnknownError"‏ • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב6 גיבורים: הסדרה: כשלון בקריאת דף אינטרנט https://www.disneyabcpress.com/disneychannel/shows/big-hero-6/, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב72 מטרים: כשלון בקריאת דף אינטרנט http://www.1tv.ru/72, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב8 נשים: כשלון בקריאת דף אינטרנט http://www.gaga.co.jp/cinemas/detail/231, מהסיבה: "The remote server returned an error: (404) Not Found." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

  בעודי עוסק ב88FM: כשלון בקריאת דף אינטרנט http://www.iba.org.il/88fm/, מהסיבה: "The remote server returned an error: (403) Forbidden." "System.Net.HttpWebResponse" "ProtocolError"‏ • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

  בוצע יבש 50 עריכות; 268 דולגו במפורש; 267 לא נצפה שינוי, 0 תקלות, 0 ארכיון, 0 לא דפים. • KotzBotדף שיחהתרומות12:40, 3 בינואר 2023 (IST)תגובה

חזרה לדף "אתר רשמי/הסרת לא פעילים".