תכנון ליניארי

ערך זה משתתף בתחרות הכתיבה "מקצרמר למובחר" של ויקיפדיה העברית והוא בשלבי כתיבה. הערך הגיע לשלב הסופי של יצירתו, וכותבו מעוניין כעת בהערותיכם ובהשגותיכם בדף השיחה. לרשימת הערכים המשתתפים בתחרות גשו לכאן. תודה על שיתוף הפעולה ובהצלחה!

מקצרמר למובחר.PNG

בעיית תכנון ליניארי היא בעיית אופטימיזציה של ביטוי ליניארי תחת אילוצים ליניאריים. כלומר, בהינתן משתנים ומערכת של אי-שוויונות בין משוואה ליניארית על הערכים לבין קבוע, למצוא את הערך המקסימלי או המינימלי שפונקציה ליניארית כלשהי יכולה לקבל. (ראו דוגמה מפורטת בהמשך הערך לבעיה כזאת) לבעיות אלה חשיבות גדולה במתמטיקה ובמדעי המחשב ואף מחוץ להם, בתחומים כמו כלכלה וחקר ביצועים.

לבעיות אלו פותחו אלגוריתמים שונים כגון שיטת הסימפלקס, אשר רצים בסיבוכיות שונה ומתאימים לבעיות שונות, והן נתונות למחקר מתמיד.

וריאציה על הבעיה בעלת חשיבות מיוחדת היא תכנון ליניארי בשלמים - אותה בעיה, בה דורשים בנוסף שהמשתנים יקבלו ערכים שלמים. בעיה זאת היא NP-שלמה וגם היא נחקרה רבות.

הקדמהעריכה

בעיית תכנון ליניארי מורכבת מאוסף משתנים  , עליהם יש אילוצים ליניאריים. אילוץ ליניארי הוא אי-שוויון בין משוואה ליניארית על המשתנים לבין קבוע, כלומר   או  . (ניתן גם לדרוש שוויון; אם תנאי הבעיה אינם מאפשרים זאת, הוא שקול לשני האי-שוויונות יחד). בנוסף ישנה פונקציית מטרה   שאותה יש למזער או למקסם.

לבעיה לא תמיד קיים פתרון (דוגמה פשוטה: התנאים הם  ), וייתכן גם שפונקציית המטרה איננה חסומה (דוגמה פשוטה: התנאים הם  , ויש למקסם את  ). לפיכך, פתרון הבעיה יכול להיות אחת משלוש אפשרויות: אין פתרון כלל, אין פתרון חסום, יש פתרון אופטימלי (שהוא לאו דווקא יחיד).

לדוגמה: נניח ש-  כלומר ישנם שלושה משתנים, והאילוצים הם

 
 
 
 

פתרון למערכת האילוצים הזאת הוא הצבה של ערכים מספריים למשתנים, כך שכל האילוצים מתקיימים. למשל   וכן   הם פתרונות למערכת. לעומת זאת,   הוא לא פתרון, שכן הוא לא מקיים את אי השוויון הראשון: לא מתקיים  .

בנוסף למערכת האי שוויונות, נניח שפונקציית המטרה היא למקסם את  . ניתן לראות שהצבת הפתרון הראשון שהצגנו נותנת  , ואילו הצבת הפתרון השני נותנת  . לכן, הפתרון השני נותן ערך גבוה יותר לפונקציית המטרה. ניתן להראות (בשיטות שידונו בהמשך הערך) שכל פתרון חוקי אחר שנציב למשתנים יתן ערך קטן יותר מ-16, ועל כן   הוא הפתרון האופטימלי.

כתיב מטרציוניעריכה

אם כל אי השוויונות נתונים באותו כיוון (כלומר בכולם   או בכולם   ) אז נוח להציג את הבעיה בעזרת מטריצות.

למשל, את הבעיה שהצגנו לעיל ניתן להציג בכתיב מטרציוני כך:

 
 

בכתיב זה, בעיית תכנון ליניארי כוללת וקטור   באורך  , מטריצה   בגודל  , וקטור   בגודל  , ווקטור   בגודל  , כך שהבעיה היא למקסם/למזער את   תחת האילוצים   או  .

צורה קנוניתעריכה

בעיית תכנון ליניארי תקרא "בצורה קנונית" אם היא מקיימת את התכונות הבאות:

  • כל התנאים הם מהצורה  
  • כל המשתנים מקיימים גם  
  • המטרה היא למקסם ביטוי ליניארי (ולא למזער אותו)

כל בעיית תכנון ליניארי ניתן להעביר לצורה קנונית:

  • אם התכונה הראשונה אינה מתקיימת, ניתן להפוך את   ל  .
  • אם התכונה השנייה אינה מתקיימת עבור משתנה  , ניתן להחליף את המשתנה   בביטוי   כאשר דורשים  .
  • אם התכונה השלישית אינה מתקיימת, ניתן להחליף את "למזער את  " ב"למקסם את  " (ווקטור הפתרון יהיה אותו וקטור).

סך הכול הגדלנו את כמות המשתנים והמשוואות פי 2 לכל היותר.

צורת slackעריכה

צורת הצגה נוספת, בעלת חשיבות באלגוריתמים כגון שיטת הסימפלקס. בצורה זו מוסיפים משתני עזר (הנקראים משתני slack) כדי תנאי הבעיה יהיו שוויונות או תנאי אי שליליות על ערכים, וגם פונקציית המטרה היא של ערך אחד בלבד.

בכתיב מטריציוני, הבעיה היא (המטריצה היא מטריצת בלוקים)

 
 
 

כאשר   הם המשתנים המקוריים,   הם משתני ה slack, ו-  הוא המשתנה שיש למקסם.

לדוגמה, אם הבעיה היא:

 
 
 
 

אז צורת ה-slack המתאימה היא:

 
 
 
 
 

הצגה גאומטריתעריכה

 
הצגה גאומטרית של תכנון ליניארי

ניתן לחשוב על הווקטורים באורך n כעל נקודות במרחב ה-n ממדי. במקרה זה, כל אילוץ חוצה את המרחב לשני חצאי מרחבים, כך שהפתרונות החוקיים נמצאים באחד מהם. אוסף האילוצים יחדיו מתורגם לחיתוך בין המרחבים.

למשל, אם ישנם שני משתנים כל התנאים הם חצאי מישורים, ואם החיתוך שלהם חסום, הוא מצולע קמור. במרחב החיתוך הוא פאון קמור. במרחב n ממדי כללי, החיתוך הוא רב-פאון (פוליטופ) קמור. (הערה: משיקולי נוחות, נתייחס בהמשך ערך זה לצורות גיאומטריות אלה כמצולע או פאון גם אם הן אינן חסומות ועל כן אינן מצולע/פאון במובן הרגיל. כך גם עושים בספרות המקצועית בנושא).

קבוצת הפתרונות האופטימליים היא פוליטופ ממד קטן יותר (או שווה במקרה שהפונקציה קבועה) שנמצאת בקצה הפוליטופ. למשל, אם הבעיה ניתנת להצגה כפאון, הרי שקבוצת הפתרונות האופטמיליים יכולה להיות קודקוד של הפאון, צלע של הפאון, או פאה שלו.

בתמונה משמאל ניתן לראות הצגה גיאומטרית של בעיית תכנון ליניארי בשני משתנים. העובדה שלבעיה שני משתנים גוררת שניתן להציג את הבעיה במישור דו ממדי. שלושת הישרים הצבעוניים הם אילוצים ליניאריים, שמחייבים את הפתרונות להיות מתחתם. בנוסף אילוצי אי שליליות על המשתנים גוררים שהם חייבים להיות ברביע הראשון. האזור שהם יכולים להיות בו מסומן בצבע כחול, וניתן לראות שהוא מחומש.

תכנון ליניארי בשלמיםעריכה

 
בעיית תכנון ליניארי שפתרונותיה בין הקווים הכחולים; הנקודות האדומות הן הפתרונות השלמים.

תכנון ליניארי בשלמים (ILP - Integer Linear Programming) מציין בעיה דומה לבעיית התכנון הליניארי, אלא שהמשתנים חייבים לקבל ערכים שלמים דווקא. בניגוד לבעיית תכנון ליניארי רגילה שלה יש פתרון פולינומי, בעיה זאת היא NP קשה. הצגתה כבעיית הכרעה (האם קיים פתרון שבו ערך פונקציית המטרה עולה על ערך מסוים) היא בעיה NP שלמה.

למעשה, זוהי אחת מהבעיות שהופיעו במאמר המפורסם של ריצ'רד קארפ מ-1972, בו הוא הציג רשימה של 21 בעיות NP שלמות. למעשה הבעיה אותה הציג קארפ חלשה הרבה יותר: המשתנים יכולים לקבל ערכים בוליאנים בלבד (0 או 1), ואין פונקציית מטרה למקסם - צריך לענות רק על השאלה האם קיים פתרון או לא. הוא הציג רדוקציה מבעיית הספיקות.[1]

כיוון שלא ידוע האם P=NP, לא ידוע האם יש אלגוריתם פולינומי לפתרון בעיית תכנון ליניארי בשלמים. עם זאת, קיימים היום אלגוריתמים שמאפשרים לפתור רבות מהבעיות בזמן סביר, ועל כן פעמים רבות רדוקציה פולינומית מבעיה מסוימת לבעיית תכנון ליניארי בשלמים מספיקה כדי למצוא לה פתרון משביע רצון. למעשה, את רוב הבעיות הNP שלמות ניתן להפוך לבעיות תכנון ליניארי בשלמים בקלות יחסית. משום כך יש לאלגוריתמים לפתרון תכנון ליניארי בשלמים חשיבות גדולה, הן תאורטית והן מעשית, והם מאפשרים לפתור בעיות סיפוק אילוצים רבות.

ניתן גם לדרוש שרק חלק מהמשתנים יהיו שלמים; בעיה כזאת נקראת "תכנון ליניארי מעורב" (MIP - Mixed Integer Programming) והיא קשה לפחות כמו תכנון ליניארי בשלמים, כי כל בעיית תכנון ליניארי בשלמים היא בפרט גם בעיית תכנון ליניארי מעורב.

תכנון ליניארי שלםעריכה

כאשר ידוע שלבעיית תכנון ליניארי יש פתרון אופטימלי שבו כל המשתנים שלמים, היא נקראת בעיית תכנון ליניארי שלמה. שימו לב שעדיין ייתכן שיהיו לה גם פתרונות אופטימליים לא שלמים, כי יכולים להיות הרבה פתרונות אופטימליים. זיהוי בעיה כזאת הוא חשוב, שכן במקרה זה אלגוריתם יעיל למציאת פתרון שלם יוכל לכלול פתרון הבעיה הרגילה (לאו דווקא בשלמים) וחילוץ הפתרונות השלמים מתוכה.

דוגמה לקריטריון כזה היא: בהינתן בעיה  , אם המטריצה   היא בעלת ערכים שלמים ויונימודולרית לחלוטין, כלומר הדטרמיננטה של כל תת-מטריצה של   היא 0, 1, או 1-. בנוסף, כל הערכים של   צריכים להיות שלמים.

דוגמאותעריכה

הקצאת משאביםעריכה

נניח שבמפעל מסוים רוצים לייצר שלושה מוצרים: מוצר 1, מוצר 2 ומוצר 3. לכל מוצר צריך כמות מסוימת של מים ושל חשמל כדי לייצר אותו. כמות המים והחשמל של המפעל מוגבלות. כמו כן לכל מוצר יש מחיר אחר בו אפשר למכור אותו. נניח שלמוצר ה-i צריך   חשמל לקילו,   מים לקילו, ומקבלים תמורתו   שקלים לקילו. סה"כ יש למפעל   חשמל ו-  מים. אז ניתן לכתוב את המשוואות הבאות:

 
 
 
 

פתרון הבעיה ימצא את המספרים  , מהם ניתן למצוא את הכמויות שנייצר מכל מוצר.

בעיית הזרמהעריכה

נאמר שבמדינה מסוימת יש 3 נמלים ו-2 תחנות כוח. בנמל מספר   פורקים בכל יום   ליטרים של נפט. תחנת כוח מספר   זקוקה ל-  ליטרים כדי לפעול. כמו כן בין נמל   לתחנה   יש כביש באורך   (כאשר עלות ההובלה של ליטר נפט לקילומטר היא קבועה). יש למצוא איך להזרים נפט במינימום מחיר.

כדי לפתור את הבעיה נגדיר 6 משתנים:

 

כאשר משתנה   פירושו "כמות הליטרים שמזרימים מנמל   לתחנה   ".

האילוצים הם:

 
 
 
 
 
 
 

שלושת האילוצים הראשונים הם על הנמלים - כל נמל יכול להוציא לכל היותר את כמות הנפט שיש לו. שני האילוצים שאחר כך הם אילוצים על התחנות - כל תחנה צריכה לקבל כמות מספקת של נפט. לאחר מכן יש אילוץ אי-שליליות (אי אפשר להעביר כמות שלילית של נפט). פונקציית המטרה היא העלות הכוללת של השינוע ויש למזער אותה.

בעיית כיסוי הקודקודיםעריכה

 
דוגמה לבעיית כיסוי קודקודים

בעיית כיסוי הקודקודים היא: בהינתן גרף  , יש למצוא קבוצת קודקודים קטנה ביותר  , כך שלכל קשת   המקיימת  , לפחות אחד מהקודקודים   נמצא ב- . זוהי בעיה NP קשה. נציג בעיית תכנון ליניארי בשלמים שפותרת אותה:

לכל קודקוד   יהיה משתנה   שאומר "הקודקוד   ב- " אז המשוואות הן: לכל קשת  , המשוואה תהיה   (כלומר לפחות אחד מהקודקודים אכן ב-S). ובנוסף נדרוש   לכל קודקוד v. (אין צורך לדרוש   שכן זה בהכרח יתקיים בפתרון המינימלי, שהרי כל פתרון שבו   ישאר כזה גם אם  ). יש למזער את הסכום  .

הפתרון של בעיה זו בשלמים יהיה פתרון לבעיית כיסוי הקודקודים. פתרון שאיננו בשלמים יתן לכל קודקוד משקל ממשי בין 0 ל-1, כך שסכום המשקלים לכל קשת הוא לפחות 1.

למשל, עבור הבעיה שבתמונה שמשמאל המשתנים הם   והאילוצים הם   בנוסף לאילוץ   לכל i. פונקציית המטרה היא  . הפתרון האופטימלי הוא   כך שהתוכנית הליניארית שלמה במקרה זה, ומצאה כיסוי מינימלי - {1,2,4}. ניתן לראות גם שעבור גרף דו צדדי תמיד יהיה פתרון בשלמים.[2]

לעומת זאת, דוגמה בה התכנית לא מוצאת פתרון בשלמים: נניח שנתון לנו גרף משולש, כלומר שלושה קודקודים עם כל הקשתות ביניהם. אזי התוכנית הליניארית שהצגנו תמצא את הפתרון  , כלומר לא פתרון חוקי לבעיית כיסוי הקודקודים.

סודוקועריכה

 
דוגמה לסודוקו

נדגים כיצד ניתן לפתור סודוקו באמצעות תכנון ליניארי בשלמים.[3]

לכל שורה  , עמודה   וספרה   ניצור משתנה   שאומר "במשבצת שנמצאת בשורה  , עמודה   נמצאת הספרה  ". כל אחד משלושת הפרמטרים הללו הוא מקבל ערכים בין 1-9 (יש 9 שורות, 9 עמודות ו-9 ספרות בסודוקו) ולכן סך הכל יש   משתנים.

האילוצים הם:

  • לכל שורה   ועמודה  , יש בדיוק ספרה אחת שנמצאת במשבצת המתאימה, כלומר בדיוק אחד מהמשתנים   מקבל את הערך 1. לכן האילוץ הוא  .
  • לכל שורה  , ולכל שתי עמודות שונות  , לא ייתכן שאותה ספרה תתקבל בשתיהן (מאילוצי הסודוקו). לכן לכל ספרה   מוסיפים את האילוץ   (לא ייתכן ששני המשתנים מקבלים את הערך 1 בו זמנית). בדומה גם   ולכל שתי משבצות   שנמצאות באותו ריבוע 3x3, גם כן נוסיף את האילוץ  .
דוגמאות לאילוצים שכאלה:  
  • הרמזים ההתחלתיים נותנים גם הם אילוצים. למשל, בסודוקו שמשמאל בשורה 1, עמודה 1 נמצאת הספרה 5. אם כן המשתנה   חייב לקבל את הערך 1, ואפשר להוסיף את האילוץ  . באופן כללי אם ברמזים נתון שבמשבצת שבשורה   ועמודה   יש את הערך  , אז אפשר להוסיף את האילוץ  .
  • נוסף לכל אלה יש להוסיף את האילוץ   לכל המשתנים.

כדי לפתור את הסודוקו, יש למצוא פתרון כלשהו בשלמים למערכת האילוצים. כלומר אין פונקציית מטרה (מבחינה פורמלית פונקציית המטרה היא הפונקציה הקבועה 0). מפתרון זה ניתן לקרוא את הפתרון. למשל בסודוקו שמשמאל נקבל שבפתרון המערכת מתקיים   ואם כן המשבצת השלישית בשורה הראשונה מקבלת את הערך 4.

שימו לב: לא יכולנו להשתמש במשתנה   כדי לקבל ישירות את הספרה שלו (למשל, שהמשתנה   יקבל בפתרון את הערך 4). הסיבה היא שצריך להוסיף, למשל, אילוצי  , ולא ניתן לעשות זאת באילוצי תכנון ליניארי.

הצורה הדואליתעריכה

עבור הבעיה   קיימת הבעיה הדואלית  כאשר   הוא וקטור m ממדי ו-   זוהי המטריצה המשוחלפת ל- . למעבר זה יש חשיבות תאורטית בהוכחות שונות, ובפרט בהוכחת הנכונות של אלגרותמים שונים.

בנוסף, ניתן למצוא גם קשר רעיוני בין הבעיות. למשל, נחזור לדוגמה הראשונה. המשוואות היו

 
 
 
 

הבעיה הדואלית היא:

 
 
 
 

ניתן לחשוב על בעיה זאת כבעיה הבאה:   הוא משתנה שמייצג חשמל, ו-  משתנה שמייצג מים. אז כל משוואה מתייחסת למוצר אחר, ומבקשת, תחת תנאי חשמל ומים, שהרווח יהיה לפחות מספר מסוים. למשל המשוואה הראשונה מתייחסת למוצר מספר 1, בו המשוואה הראשונה דורשת שנשקיע מספיק חשמל ומים כדי לקבל את הרווח  . בדומה משוואות 2,3 מתייחסות למוצרים 2,3 בהתאמה. תחת תנאים אלה, יש למזער את העלות הכוללת של מים וחשמל.

הבעיה הדואלית לדוגמה השנייה כוללת את המשתנים  , משתנה לכל קשת, כך שלכל קודקוד יש את המשוואה   ויש למקסם את  . כאשר המשתנים שלמים, הבעיה היא למצוא קבוצת קשתות מקסימלית כך שכל קודקוד נוגע בלכל היותר אחת מהן - בעיה הידועה כמציאת שידוך מקסימלי (לה יש פתרון פולינומי).

משפטי הדואליותעריכה

משפט הדואליות החלש קובע שאם הבעיה   היא בצורה קנונית, אז הבעיה הדואלית   מקיימת שלכל זוג פתרונות   מתקיים  , ובפרט גם לפתרונות האופטימליים. . משפט הדואליות החזק קובע שלפתרונות האופטימליים   (אם הם קיימים - או שאחת הבעיות לא חסומה, ואז השנייה לא פיזיבלית).

משפט הדואליות החלש מאפשר למצוא תנאי עצירה לאלגוריתמים שונים: אם מריצים את האלגוריתם על הבעיה ועל הבעיה הדואלית לה במקביל, מקבלים חסמים מכל בעיה על השנייה: לכל   שמוצאים,   מהווה חסם עליון ל- , ולהפך.

ממשפט הדואליות החזק נובע משפט זרימה מקסימלית - חתך מינימלי, משפט קניג ומשפט המינימקס.

הוכחהעריכה

ההוכחה למשפט הדואליות החלש פשוטה למדי ודורשת מניפולציות על איברים בלבד:

מתקיים  . כיוון ש-  הוא פתרון, אז לכל   מתקיים  . כמו כן, כיוון ש-  הוא פתרון, לכל   מתקיים  . נשלב את כל זאת כדי לקבל:

 

כרצוי.

בעיות כיסוי ואריזהעריכה

בעיה בצורה קנונית   נקראת "בעיית אריזה" אם כל ערכי המטריצות והווקטורים   הם בעלי ערכים אי שליליים. הסיבה לכינוי זה היא שאנחנו מנסים למקסם את מה שאנחנו מכניסים לערכים תוך מגבלה מלמעלה - כמו אדם שמנסה לארוז כמה שיותר לתוך נפח מוגבל.

בעיה בצורה הדואלית,  , תקרא "בעיית כיסוי" אם היא מקיימת תכונה זו. הסיבה לכינוי זה היא שאנחנו מנסים למצוא ערכים קטנים ביותר שיעברו סף מסוים - מנסים לכסות את הערכים ב- .

לבעיות אלה חשיבות מיוחדת, בפרט בשלמים, ואלגוריתמים רבים פותחו במיוחד בשבילן.

דוגמאות לבעיות אריזה הן בעיית תרמיל הגב, מציאת קבוצה בלתי תלויה מקסימלית, בעיית אריזת קבוצות (set packing) ובעיית אריזת הדליים (bin packing).

דוגמאות לבעיות כיסוי הן בעיית כיסוי קודקודים ובעיית כיסוי קבוצות.

אלגוריתמיםעריכה

שיטת הסימפלקסעריכה

 
הדגמה ויזואלית לשיטת הסימפלקס. הולכים לאורך צלעות הפאון מקודקוד לקודקוד, עד לפתרון אופטימלי.

האלגוריתם הוותיק ביותר הוא אלגוריתם הסימפלקס. למעשה הוא לא אלגוריתם במובן הרגיל אלא משפחה של אלגוריתמים, שכן אחד הצעדים בו לא מוגדר וניתן לממש אותו בדרכים שונות. האלגוריתם הומצא בשנת 1947 על ידי ג'ורג' דנציג.

האינטואיציה מאחורי השיטה מתקבלת מההצגה הגיאומטרית לעיל. כאמור, מרחב הפתרונות הפיזיביליים הוא פוליטופ קמור. ניתן לראות שאם נעים על קו ישר, פונקציית המטרה הליניארית היא מונוטונית על הקו הזה. מכאן נובע שהערך המקסימלי יתקבל על אחד הקודקודים (אלא אם הפוליטופ לא חסום). שיטת הסימפלקס היא: מתחילים מקודקוד כלשהו, מסתכלים על הקודקודים שמחוברים אליו בצלע, בוחרים אחד מהם עליו פונקציית המטרה גדולה או שווה, ועוברים אליו (צעד המעבר נקרא pivot). לא עוברים אל קודקוד שכבר היינו בו. אם האלגוריתם מסתיים, זה כיוון שאין קודקודים יותר גדולים לעבור אליהם, וסיימנו בהצלחה. כיוון שמספר הקודקודים סופי, האלגוריתם יסתיים בזמן סופי.

זמן ריצת האלגוריתם: צעד pivot לוקח  , לכן זמן הריצה הוא  , כאשר   הוא מספר הצעדים שנעשה.   חסום על ידי מספר הקודקודים שעלול להיות אקסופננציאלי, לכן זמן הריצה עלול להיות אקספוננציאלי. עד היום לא ידועה שיטה פולינומית לממש את זמן הריצה (אך גם לא ידוע שאין שיטה כזאת), ויש חסם תחתון אקספוננציאלי על רבות מהשיטות.

שיטת האליפסואידעריכה

 
איטרציה של שיטת האליפסואיד. עוברים מהאליפסה האדומה לאליפסה הירוקה, שמכילה גם היא את השטח הכחול.

השיטה נמצאה ב 1979 על ידי לאוניד חצ'יאן, והיוותה פריצת דרך תאורטית גדולה בכך שהוכיחה זמן ריצה פולינומי, אך איננה מעשית לערכי n שאינם קטנים מאוד. בשיטה מתחילים מאליפסואיד גדול מספיק כדי להכיל את הנקודה המינימלית, ואז בסדרת צעדים מקטינים את האלפיסואיד כך שהוא עדיין כולל אותה, עד שהאליפסואיד קטן מספיק.

האלגוריתם רץ בסיבוכיות  , כאשר   הוא אורך הקלט - מספר הביטים שצריך כדי לתאר את כל הבעיה.

האלגוריתם של קרמקרעריכה

אלגוריתם שנמצא על ידי המתמטיקאי ההודי נרמנדה קרמקר. אף על פי שלא היה האלגוריתם הפולינומי הראשון, הוא היה האלגוריתם הפולינומי הראשון שרץ בזמן מעשי (אף על פי שבדרך כלל שיטת הסימפלקס עדיפה על קלטים אמיתיים).

האלגוריתם נקרא גם "שיטת הנקודה הפנימית" (interior point method) משום שהוא "מחפש" את הנקודה האופטימלית בפנים הפוליטופ, ולא על שפתו כמו שיטת הסימפלקס. זמן הריצה שלו הוא  

האלגוריתם הנוכחיעריכה

נכון ל-2022, האלגוריתם הטוב ביותר הידוע רץ בסיבוכיות  ,[4] כאשר   הוא המעריך של ביצוע כפל מטריצות, כלומר כזה שניתן עבורו להכפיל מטריצות בסיבוכיות   (נכון ל-2022, ידוע  ), ו-  הוא המעריך הדואלי של כפל מטריצות, כלומר המספר המקסימלי עבורו ניתן להכפיל מטריצות בגודלי   בזמן   (נכון ל-2022, ידוע  ).

אלגוריתמים למציאת פתרון בשלמיםעריכה

כאמור לעיל, הבעיה בשלמים היא NP קשה, לכן בהנחת  , אין לה אלגוריתם פולינומי, אפילו אם לא מנסים למקסם פונקציית מטרה. לכן אלגוריתמים לפתרון תכנון ליניארי בשלמים עושים את אחד הדברים הבאים:

  • רצים במקרה הגרוע בזמן אקספוננציאלי (במטרה שעל קלטים סבירים יסיימו בזמן סביר).
  • מוצאים פתרון שלא מקיים את כל האילוצים (במטרה למצוא פתרון שיקיים כמה שיותר).
  • רצים רק על קלטים שמקיימים הנחות כלשהן.
  • דורשים הרצה פעם אחת של אלגוריתם בזמן אקספוננציאלי, שמאפשרת מציאת מידע איתו יהיה אפשר לפתור בעיות רבות בזמן פולינומי.
  • רצים במקרים בהם ברור שיש פתרון (למשל, לבעיות אריזה תמיד קיים פתרון ה-0. לבעיות כיסוי תמיד יש פתרון בו כל המשתנים מקבלים את הערך המקסימלי של הווקטור  [5]) ומנסים לקרב את פונקציית המטרה.

שימוש באלגוריתמים הרגיליםעריכה

שימוש באלגוריתם של בעיית תכנון ליניארי רגילה יניב פתרון שאיננו דווקא בשלמים. במקרה זה יש כמה דרכים לקבל ממנו פתרון רגיל. אפשר למשל, לעגל את כל המשתנים אל הערך הקרוב ביותר. אפשר גם במקרה של המשתנים הם אינדיקטורים (מקבלים ערכים בין 0 ל-1), עבור משתנה שקיבל את הערך  , להגריל לו את הערך 1 בהסתברות   ו-0 בהסתברות  . שיטות אלה יכולות להוביל לפתרונות שאינם מקיימים את כל האילוצים, או שאינם אופטימלים.

בבעיות אריזה, אם מעגלים את כל הערכים למטה, מקבלים פתרון חוקי (כי כל הערכים נשארו אי שליליים, ואי-הגדלה של כל המשתנים לא יכולה לסתור אילוץ). הוא עשוי להיות קטן מהפתרון האופטימלי, אך אם פונקציית המטרה היא  , ניתן לדעת שעיגול כל הערכים למטה יקטין כל משתנה בלכל היותר 1, ולכן יקטין את פונקציית המטרה בלכל היותר  . בדומה, עיגול למעלה של כל הערכים בבעיית כיסוי ימצא פתרון חוקי שפונקציית המטרה עליו עשויה להיות רחוקה ב-  מהערך האופטימלי.

קיימים גם אלגוריתמים יותר מתוחכמים, למשל שיטת branch and cut, בה מוסיפים אילוצים נוספים כדי לכפות על המשתנים להיות שלמים, ובמידת הצורך מפצלים את הבעיה לכמה תתי בעיות, תוך "גדיעת" ענפים - לא נכנסים לתתי בעיות שאפשר לראות שלא יהיו טובות יותר מאחרות שניסינו כבר. שיטה זאת תמיד מוצאת את הפתרון האופטימלי וגם יעילה למדי על קלטים אמיתיים, אך זמן הריצה במקרה הגרוע הוא אקספוננציאלי.

את כל השיטות הללו ניתן להפעיל גם על חלק מהמשתנים במקרה שרק על חלקם יש דרישת שלמות.

בסיס גרייברעריכה

  ערך מורחב – בסיס גרייבר

בהינתן מטריצה A בשלמים, בסיס גרייבר מאפשר לבצע עליה עיבוד מוקדם (שזמנו אקספוננציאלי) כדי לקבל מידע, בעזרתו יהיה אפשר לפתור את הבעיה   בזמן פולינומי לכל וקטורים שלמים  . השיטה מבוססת על מציאת קבוצה סופית של איברים   (שנקראת בסיס גרייבר), שמהם ניתן לחלץ פתרונות באמצעות אלגוריתם איטרטיבי.

אלגוריתם לנסטרהעריכה

אלגוריתם לנסטרה[6] מאפשר לפתור את הבעיה בזמן פולינומי כאשר מספר המשתנים קבוע. יותר בפירוט, אם ב-A יש   שורות והמקדמים שלה חסומים על ידי  , האלגוריתם מאפשר לפתור בזמן פולינומי ב- . האלגוריתם עובר על המשתנים בזה אחר זה ומוצא קטע לכל אחד מהם בו הוא חסום בעזרת גאומטריה של מספרים, ולאחר מכן עובר על כל האפשרויות. האלגוריתם הומצא על ידי הנדריק לנסטרה בשנת 1983. זמן הריצה המקורי היה  , ומאז שופר כמה פעמים.

אלגוריתמים כללייםעריכה

ניתן להשתמש באלגוריתמים כלליים, שאינם מיוחדים דווקא לתכנון ליניארי. נסקור כמה מהם בקצרה:

  • backtracking (לבעיות אריזה): בהינתן משתנה  , והצבות לערכים  , נציב ב  את הערכים מ-0 ומעלה בזה אחר זה, ולכל אחד מהם נפתור רקורסיבית עבור המשתנה הבא. מפסיקים כאשר אחד האילוצים נשבר. אם   (ומצאנו הצבה שנותנת פתרון חוקי) זוכרים את ערך פונקציית המטרה, כדי להחזיר את הערך המינימלי. האלגוריתם מסתיים כאשר עוברים על כל הערכים עבור   (ואז הפתרון מדויק, אך הזמן עלול להיות אקספוננציאלי) או כאשר עובר זמן שהוגדר מראש (ואז הוא לאו דווקא ימצא את הפתרון האופטימלי).
  • להתחיל עם פתרון כלשהו ולשפר אותו בעזרת אלגוריתמים כגון חיפוש מקומי או אופטימיזציית קן הנמלים.
  • שיטות שונות של למידת מכונה, למשל רשת עצבית מלאכותית.

היסטוריהעריכה

 
לאוניד קנטורוביץ'

העיסוק בבעיה התפתח באופן נפרד במערב ובברית המועצות.

הראשון שעסק בבעיה היה לאוניד קנטורוביץ', שב 1939 ניסח את הבעיה הכללית וחקר דרכים לפתור אותה. הוא פרסם את מחקרו במאמר בשם "שיטות מתמטיות לארגון ותכנון של הייצור"[7] בו הוא נתן דוגמאות שונות ושיטות לפתרון.[8] הוא טען שתכנון ליניארי נצרך רק בכלכלה קומוניסטית, כיוון שבכלכלה קפיטליסטית בעלי ההון ידאגו להקצאת משאבים.[9] במהלך מלחמת העולם השנייה הוא ניסה לרתום את מחקריו למאמץ המלחמתי, אך זכה להתעלמות בברית המועצות.[10] מעט אחר כך, טיאלינג קופמאנס עסק בארצות הברית באופן בלתי תלוי בבעיה. ב-1975 חלקו קנטורוביץ' וקופמאנס פרס נובל לכלכלה על מחקרם בנושא.[11]

ב-1946 חקר את הבעיה ג'ורג' דנציג, במסגרת עבודתו בחיל האוויר האמריקאי על בעיות לוגיסטיקה, כהכללה של שיטותיו של וסילי לאונטיף על מידול בעיות כלכליות באמצעות מטריצות.[12] הוא עבד על הבעיה עם קומפאנס, וב-1947 פיתח את שיטת הסימפלקס.[13] כמו כן, בשנת 1948 הציג דנציג את מחקרו בפני ג'ון פון ניומן. בתגובה, ניומן הציג לו את מחקרו על תורת המשחקים ואת הקשר שזיהה בין מחקר זה לבין הדואליות של תכנון ליניארי, ושיער את משפט הדואליות החזק. דנציג הוכיח את המשפט אך פרסם בתפוצה פנימית בלבד. הראשונים שפרסמו הוכחה פורמלית ברבים היו תלמידיו של ניומן - אלן טאקר, דייוויד גייל והרולד קון.[14]

במשך שנים לא היה ידוע האם יש לבעיה גם פתרון פולינומי. בעיה זאת נפתרה ב-1979 כאשר ליאוניד חצ'יאן מצא את שיטת האליפסואיד. התגלית היוותה סנסציה, וכונתה במערב "הספוטניק של 1979".[15] אף על פי פריצת הדרך התאורטית, האלגוריתם לא מעשי. עם זאת, בשנת 1984 מצא נרמנדה קרמקר אלגוריתם פולינומי ומעשי שמכונה "שיטת נקודות הפנים".[16] הבעיה המשיכה להיות מוקד של מחקר פעיל, ובמהלך השנים הבאות זמן הריצה שופר שוב ושוב, למשל בשנת 1987 ובשנת 1989 על ידי פרווין פאידה.[17]

גם תכנון ליניארי בשלמים נחקר כבר על ידי דנציג, שנתן כדוגמה בעיית השמה של 70 משימות ל70 אנשים, תוך אילוצים שונים, בעיה שאיננה ניתנת לפתרון באמצעות כוח גס (בוודאי לא באמצעים של אז, וגם לא כיום), מאחר שלשם כך דרוש לבדוק 70 עצרת אפשרויות.[18] לאחר הוכחת משפט קוק לוין, התברר שישנן בעיות NP שלמות ושתכנון ליניארי היא בעיה כזאת, וב-1972 כלל אותה קארפ במאמרו בו הציג בעיות NP שלמות.[1] מאז נעשה מחקר רב בנושא, אך פתרון פולינומי לא נמצא.

LP Solversעריכה

מפאת חשיבותה המעשית של בעיית התכנון הליניארי, פותחו כלים רבים המאפשרים פתרון של הבעיה, עבור שפות שונות, גם באקדמיות, גם באופן מסחרי וגם באופן וולנטרי. תוכנה שמאפשרת פתרון מעשי של בעיות תכנות ליניארי נקראת LP solver. דוגמה ל-LP solver היא cvxpy, אשר נכתב עבור שפת פייתון בקוד פתוח.[19] נראה כדוגמה תוכנה שתפתור את הבעיה שניתנה בתחילת הערך:

import cvxpy
x1 = cvxpy.Variable(name="x1")
x2 = cvxpy.Variable(name="x2")
x3 = cvxpy.Variable(name="x3")
constraints = [
    3 * x1 - 2 * x2 + x3 <= 9,
    7 * x2 - 2 * x3 <= 6,
    -5 * x1 + 10 * x2 <= 5,
    x1 + x2 - x3 <= 9,
]
target = cvxpy.Maximize(2 * x1 + 3 * x2 + x3)
problem = cvxpy.Problem(target, constraints)
problem.solve()
print(f"x1={x1.value}, x2={x2.value}, x3={x3.value})

הרצת התוכנית מדפיסה את הפלט x1=3, x2=2, x3=4.

ראו גםעריכה

קישורים חיצונייםעריכה

  מדיה וקבצים בנושא תכנון ליניארי בוויקישיתוף

הערות שולייםעריכה

  1. ^ 1 2 Richard Karp, reducibility among combinatoricial problems
  2. ^ Packing, Covering and Partitioning Problems with Strongly Unimodular Constraint Matrices
  3. ^ הדגמה של הפתרון
  4. ^ Solving Empirical Risk Minimization in the Current Matrix Multiplication Time
  5. ^ נזכיר שבעיית כיסוי היא בצורה דואלית לקנונית, ופונקציית המטרה היא  
  6. ^ Integer Programming with a Fixed Number of Variables
  7. ^ המאמר מתורגם לאנגלית
  8. ^ mathematical methods of organizing and planning production, עמוד 390
  9. ^ mathematical methods of organizing and planning production, עמוד 368
  10. ^ reminiscences about the origin of linear programming, עמוד 1
  11. ^ נימוקי הזכייה באתר פרס נובל
  12. ^ reminiscences about the origin of linear programming, עמוד 2
  13. ^ reminiscences about the origin of linear programming, עמוד 4
  14. ^ reminiscences about the origin of linear programming, עמוד 6
  15. ^ Eugene L. Lawler, The Great Mathematical Sputnik of 1979
  16. ^ Narendra Karmarkar, A New Polynomial-Time Algorithm for Linear Programming
  17. ^ Speeding-up linear programming using fast matrix multiplication, Pravin M. Vaidya
  18. ^ REMINISCENCES ABOUT THE ORIGINS OF LINEAR PROGRAMMING, עמוד 2
  19. ^ אתר הבית של cvxpy