שיחת תבנית:ערוץ7/הסבת קישורים חיצוניים

תגובה אחרונה: לפני 5 שנים מאת בורה בורה בנושא סטטוס
בוט ההסבה

ראו גם:

מבוא

הועבר מהדף ויקיפדיה:דלפק ייעוץ
כמו שכתבתי למעלה בעבר, בערוץ 7 החליפו את הקידומת של האתר מhttp לhttps. תודה רבה לדוד שי שתיקן את התבניות הרלוונטיות, אבל קיימים קישורים שלא נעזרו בתבנית, אלא הוכנסו כקישור רגיל. האם מישהוא יכול להריץ בוט שיחליף את כל הקישורים?
הבוט צריך להחליף את כל המופעים של http://www.inn.co.il בhttps://www.inn.co.il.
תודה ולילה טוב. david7031שיחה • ד' באדר ב' ה'תשע"ט • 23:33, 10 במרץ 2019 (IST)תגובה

לא. הבוט צריך להחליף את כל המופעים בתבנית כדי ששינוי אחר בעוד כמה חודשים לא יצריך שינוי מחדש של עשרות או מאות דפים. בורה בורה האם תוכל לראות אם ניתן להסב את אותם קישורים לתבנית? לפי מיוחד:חיפוש_קישורים_חיצוניים/http://www.inn.co.il יש 2167 כאלו (חלקם יתאימו ל{{בשבע}}.). אינג. יונה ב. - שיחה - הבה נכחילה 10:41, 11 במרץ 2019 (IST)תגובה
יונה ב., ממה שאני רואה אין קישורים שבורים, רק "קישורים לא יפים". אפשר לעשות אבל צריך מפרט מדויק איך מזהים מה עובר לאיזו תבנית ובאלו תנאים. אנא כתוב את המפרט בפרק המבוא של שיחת תבנית:ערוץ7/הסבת קישורים חיצוניים. תוכל לראות שם דוגמה מהסבת קודמת דומה. בורה בורה - שיחה 16:07, 11 במרץ 2019 (IST)תגובה
ואו, יש מעל 2000 דפים כאלה. מיכאל.צבאןשיחה • ה' באדר ב' ה'תשע"ט • 10:31, 12 במרץ 2019 (IST)תגובה

סוף העברה
בורה בורה - שיחה 13:13, 14 במרץ 2019 (IST)תגובה

תקציר עריכה

הפיכת קישור חיצוני ידני לתבנית:ערוץ7

חיפושים

insource:/www.inn.co.il/

מרחבי שם

+מדיה +מרחב הערכים +משתמש +קובץ +תבנית +קטגוריה +פורטל +ספר +טיוטה +מדיה ויקי +יחידה +הוראה +נושא

ערכים להסבה

ביטוי רגולרי להסבה

(?ix)
(?<=\n) # must start on start of line
\s*
[*]
\s*
\[\s*
https?://(www.)?inn.co.il/
(?<מדור>.+)\.aspx
/
(?<מזהה>[0-9]+)
\s+
(?<כותרת>
    [^\]]*
)
\]
\s*
,?
\s*
(?<נוסף>.*)
\s*,
.*

מפרט הסבה

* {{ערוץ7||<<<כותרת>>>|<<<מזהה>>>|<<<נוסף>>>|<<<מדור>>>}}

סטטוס

משתמש:Dovno תוכל לכתוב ביטוי רגולרי שמסוגל לבצע התמרה כזו? תוכל לעדכן את הביטוי לעיל שכרגע בנוי על בוט אחר?

בורה בורה - שיחה 23:30, 14 במרץ 2019 (IST)תגובה

המקור אמור להיות בהכרח בצורה המדוייקת הזו? [קישור כותרת], תאריך, "ערוץ 7"? כולל הפסיקים, כולל התאריך וכולל "ערוץ 7" בסוף? או שיש מגוון צורות לתפוס? Dovno - שיחה 23:57, 14 במרץ 2019 (IST)תגובה
בגדול, הביטוי הבא אמור לתפוס את זה:

(?ix)\s*\[\s*http:\/\/www.inn.co.il\/(.*)\.aspx\/([0-9]+)\s+(.*)\]\s*,\s*(.*)\s*,.*

ואני לא בטוח איך זה אמור להופיע בסינטקס של ביטויים רגולריים להחלפה בוויקיפדיה עבור הבוט, אבל ההחלפה הבאה ביחס לביטוי הרגולרי הקודם אמורה לעבוד:

{{ערוץ7||\3|\2|\1|\4}}

Dovno - שיחה 00:13, 15 במרץ 2019 (IST)תגובה
לדעתי יש אינסוף ביטויי קלט... אבל עד שלא נבדוק לא נדע. מתחיל בנסיונות. בורה בורה - שיחה 01:24, 15 במרץ 2019 (IST)תגובה
Dovno לא הבנתי איך אתה מבצע את ההצבות לתבנית עצמה. בריצה הקודמת הביטוי הרגולרי נתן ערך לשדות ואת השדות הצבנו כמרמטרים בתבנית.

זה הביטוי עם ההצבות:

(?ix) [*] [ ]* .* \[\s*http:\/\/www.tidhar.tourolib.org\/tidhar\/view\/ (?<כרך>[0-9]+) \/ (?<עמוד>[0-9]+) [\s'"()]* .* \] .*

וכך הצבנו:

* {{תדהר|<<<כרך>>>|<<<עמוד>>>}}

על כן כאן צריך לעשות משהו דומה. או פרמטרים מספריים 1 עד 5 או שמיים. למשל:

{{ערוץ7|1=|2=|3=|4=|5=}}

תוכל לעיין בדפי הפלט מה יצא עד עכשיו. אם זה יעבוד טוב נמצא דרך להשמיט את 1= וכו'. בורה בורה - שיחה 02:02, 15 במרץ 2019 (IST)תגובה

משתמש:Dovno יצא לך לעיין בזה? בורה בורה - שיחה 06:38, 17 במרץ 2019 (IST)תגובה
צר לי, אך לא היה לי עדיין זמן להתעמק באפשרויות ולהשוות מול הריצות הקודמות בתבנית תדהר. מה שאני כתבתי כהצעה לא מתאים לפורמט של המנוע שמריץ את זה בוויקיפדיה (עם השימוש ב - <<< ו- >>>), אבל זה עובד על הדוגמה שנתת במנוע אחר, כמו למשל כאן. אני מקווה שבהמשך היום יהיה לי זמן להתעמק בכך יותר. Dovno - שיחה 09:26, 17 במרץ 2019 (IST)תגובה
אוקיי, זה חצי ניחוש לפי הסינטקס של הביטוי מתבנית תדהר, אבל משהו כזה:

(?ix)\s*\[\s*http:\/\/www.inn.co.il\/(?<מדור>.+)\.aspx\/(?<מזהה>[0-9]+)\s+(?<כותרת>.*)\]\s*,?\s*(?<נוסף>.*)\s*,.*

והסבה:

* {{ערוץ7||<<<כותרת>>>|<<<מזהה>>>|<<<מדור>>>|<<<נוסף>>>}}

זה לא יתפוס כל מקרה, אבל אם הבנתי נכון מה נעשה ב"תדהר", יעבוד בערך עבור הדוגמה שנתת. הסיבה ש"בערך" היא שזה ימשוך גם את ה"ערוץ 7" שבסוף הטקסט המקורי. אפשר לשפר את הביטוי שיתעלם מזה אבל זה לא יהיה גמיש ויעבוד רק עם תמיד בסוך יש ', "ערוץ 7"', בדיוק בצורה זו. Dovno - שיחה 22:59, 17 במרץ 2019 (IST)תגובה
Dovno התקדמות ללא ספק. אבל עדיין תיקונים. ראה דוגמה מהערך אבי שגיא-שורץ:

"מחקר: אין טראומת דור שני ושלישי", באתר ערוץ 7, 15 באפריל 2007

  • {{ערוץ7||"מחקר: אין טראומת דור שני ושלישי"], באתר [[ערוץ 7]|161447|News/News|}}

להלן מה לשפר:

  1. הסר לגמרי את ה-[] למיניהם. זה מסבך אותך ואת התוצר הסופי וממילא לא צריך את זה במבנה התבנית
  2. אתה שם בפרמטר הרביעי "תאריך" את הפרמטר החמישי "מדור"
  3. צריך להכניס את התאריך שכרגע חסר
  4. אם אפשר להסיר בפלט את המילים "באתר ערוץ 7". אני מודע שכל אחד כתב מה שבא לו אז אולי זה לא ישים
  5. ככה זה יראה לאחר התיקונים שהצעתי. ערכתי על בסיס הפלט שלך.
  1. צודק שצריך בדוגמת ההסבה שלי להחליף בין <<<מדור>>> לבין <<<נוסף>>> ("נוסף" זה התאריך - או כל מלל שלאחר הקישור).
  2. יש בדדוגמה הזו (ובאחרות) בעיה מסויימת בכך שבטקסט "באתר ערוץ 7" או "ערוץ 7" מופיע בצורות שונים בקלט (עם ובלי מרכאות, עם ובלי קישור, וכו'), והביטוי הרגולרי ימשוך את זה או כחלק מהכותרת או כחלק ה"נוסף" (שהוא בדר"כ התאריך", ולכן בפלט הסופי יופעי "באתר ערוץ 7" פעמיים (פעם מהתבנית עצמה ופעם מהטקסט שנמשך). פתרון כללי או לדלג על כך - לא לנסות למשוך את הטקסט הנוסף מעבר לקישור עצמו, ובכך לאבד את המידע של התאריך (כפי שהביטוי כרגע יאבד מידע על הכותב, אם ישנו לפני הקישור.
  3. לגבי הסוגריים המרובעים, אני לא בטוח בפורמט הכי מתאים כאן. בדוגמה שהבאת, מה שקרה הוא שבמקום להחליט ש: <<<כותרת>>> היא "מחקר: אין טראומת דור שני ושלישי", וש: <<<נוסף>>> הוא "באתר ערוץ 7, 15 באפריל 2007", הביטוי הרגולרי שולף את הכותרת לא נכןו, כי הוא רץ עד ה=']' האחרון שהוא מוצא (שסוגר את "ערוץ 7" מחוץ לקישור עצמו) לא עד הראשון (שסוגר את הקישור). לא בטוח איך הכי טוב לתפוס את זה. אולי כך (עבור הכותרת מחפש רצף תווים שלא מכילים סגירת סוגריים מרובעים):

(?ix)\s*\[\s*http:\/\/www.inn.co.il\/(?<מדור>.+)\.aspx\/(?<מזהה>[0-9]+)\s+(?<כותרת>[^\]]*)\]\s*,?\s*(?<נוסף>.*)\s*,.*

Dovno - שיחה 08:09, 18 במרץ 2019 (IST)תגובה
בורה, זכור שיש לתקן את ההסבה להיות:

* {{ערוץ7||<<<כותרת>>>|<<<מזהה>>>|<<<נוסף>>>|<<<מדור>>>}}

Dovno - שיחה 09:34, 18 במרץ 2019 (IST)תגובה
התיקון שלך קלקל דברים אחרים... ראה את דפי הפלט. בורה בורה - שיחה 09:36, 18 במרץ 2019 (IST)תגובה
בורה בורה, ראיתי. (א) יש לתקן את מפרט ההסבה עצמו כפי שכתבתי. (ב) מעבר לכך יש להתייעץ עם המומחים הרגילים שטיפלו בהסבות קודמות. הביטוי שכתבתי עובד לגמרי במנועים אחרים (כמו regex101.com), אולם אני לא מבין מספיק את הדקויות של המנוע המסויים בו משתמשת ויקיפדיה כדי לעבור על הביטויים הרגולריים. Dovno - שיחה 09:40, 18 במרץ 2019 (IST)תגובה
בנוסף, מהפלט אני רואה שמה שעובר אל הביטוי הרגולרי הוא לא רק הקישור לערוץ 7 אלא גם המשך משפטים, קישורים אחרים, ותבניות קטועות. Dovno - שיחה 09:42, 18 במרץ 2019 (IST)תגובה
החוכמולוגיה בהסבות האלה היא ב"ביטוי רגולרי להסבה". מפרט ההסבה רק מציב מה שהביטוי הרגולרי נותן לו. כך שאני לא רואה מה יש לתקן את מפרט ההסבה עצמו. הבה ונשאל לדעת גדול הדור משתמש:Kotz מה אפשר לעשות כאן. בורה בורה - שיחה 09:45, 18 במרץ 2019 (IST)תגובה

בורה בורה, Dovno, ראו בבקשה עריכותי האחרונות בדף זה, תיעדתי בנפרד כל שינוי. נראה שלא הגבלתם ההסבה לקשח"צים ולכן הוא תפס מיני דברים אחרים. הביטוי הרגולרי שמשתמשים בו כאן הוא זה של C# , ר' [1]. ‏«kotz» «שיחה» 09:08, 19 במרץ 2019 (IST)תגובה

משתמש:Kotz משהו תוקע את התור. בורה בורה - שיחה 10:06, 19 במרץ 2019 (IST)תגובה
משתמש:Kotz כמעט בכל הערכים לא מתבצעת הצבה בתבנית בכלל. תוכל לבדוק למה? בורה בורה - שיחה 18:32, 19 במרץ 2019 (IST)תגובה
משתמש:Kotz יהיה לך זמן לזה? מאות קישורים שבורים. בורה בורה - שיחה 00:42, 10 במאי 2019 (IDT)תגובה

ריצות

 מתחיל בעבודה, אטפל ב-1,381 דפים מתוך 1,381. KotzBotדף שיחהתרומות01:31, 15 במרץ 2019 (IST)תגובה

  בוצע יבש 284 עריכות; 0 דולגו במפורש; 782 לא נצפה שינוי, 0 תקלות, 6 ארכיון, 0 לא דפים. ההסבה נעצרה לאחר 9 עמודי פלט @מש:בורה בורהKotzBotדף שיחהתרומות01:33, 15 במרץ 2019 (IST)תגובה

 מתחיל בעבודה, אטפל ב-1,381 דפים מתוך 1,381. KotzBotדף שיחהתרומות01:42, 15 במרץ 2019 (IST)תגובה

  בוצע יבש 284 עריכות; 0 דולגו במפורש; 782 לא נצפה שינוי, 0 תקלות, 6 ארכיון, 0 לא דפים. ההסבה נעצרה לאחר 9 עמודי פלט @מש:בורה בורהKotzBotדף שיחהתרומות01:44, 15 במרץ 2019 (IST)תגובה

 מתחיל בעבודה, אטפל ב-1,381 דפים מתוך 1,381. KotzBotדף שיחהתרומות04:18, 18 במרץ 2019 (IST)תגובה

  בוצע יבש 205 עריכות; 0 דולגו במפורש; 224 לא נצפה שינוי, 0 תקלות, 0 ארכיון, 0 לא דפים. ההסבה נעצרה לאחר 9 עמודי פלט @מש:בורה בורהKotzBotדף שיחהתרומות04:19, 18 במרץ 2019 (IST)תגובה

 מתחיל בעבודה, אטפל ב-1,380 דפים מתוך 1,380. KotzBotדף שיחהתרומות09:31, 18 במרץ 2019 (IST)תגובה

  בוצע יבש 213 עריכות; 0 דולגו במפורש; 232 לא נצפה שינוי, 0 תקלות, 0 ארכיון, 0 לא דפים. ההסבה נעצרה לאחר 9 עמודי פלט @מש:בורה בורהKotzBotדף שיחהתרומות09:31, 18 במרץ 2019 (IST)תגובה

 מתחיל בעבודה, אטפל ב-1,381 דפים מתוך 1,381. KotzBotדף שיחהתרומות16:01, 19 במרץ 2019 (IST)תגובה

  בוצע יבש 159 עריכות; 0 דולגו במפורש; 1216 לא נצפה שינוי, 0 תקלות, 6 ארכיון, 0 לא דפים. @מש:בורה בורהKotzBotדף שיחהתרומות16:04, 19 במרץ 2019 (IST)תגובה

חזרה לדף "ערוץ7/הסבת קישורים חיצוניים".