חשבון וריאציות – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ הוספת תבנית:בריטניקה בקישורים חיצוניים (תג)
שיפוץ קודים מתמטיים, מש:עוזי ו. אשמח לחוו"ד או לשיחזור במקרה הצורך(:
שורה 1:
'''חשבון וריאציות''' הוא תחום במתמטיקה אשר עוסק במציאת [[נקודת קיצון|נקודות קיצון]] של [[פונקציונל|פונקציונלים]], בניגוד ל[[חשבון דיפרנציאלי ואינטגרלי|חשבון דיפרנציאליאינפיניטסימלי]] רגיל אשר עוסק ב[[פונקציה|פונקציות]]. פונקציונל הוא בדרך כלל מיפוי מ[[קבוצה (מתמטיקה)|קבוצהקבוצת]] של פונקציות ל[[שדה המספרים הממשיים]]. פונקציונלים לרוב מבוטאים כ[[אינטגרל|אינטגרלים מסוימים]] של פונקציות בלתי ידועות ו[[נגזרת|נגזרותיהן]]. המטרה היא מציאת פונקציות אשר יביאו את הפונקציונל למקסימום או למינימום.
 
השיטה פותחה בשלהי [[המאה ה-17]] על ידי [[אייזק ניוטון|ניוטון]], האחים [[יוהאן ברנולי|יוהאן]] ו[[יאקוב ברנולי]], [[גוטפריד וילהלם לייבניץ|לייבניץ]], ומאוחר יותר על ידי [[המרקיז דה לופיטל|לופיטל]], [[לאונרד אוילר|אוילר]], [[ז'וזף לואי לגראנז'|לגראנז']] ואחרים.
 
הדוגמה הפשוטה ביותר לבעיה כזו היא מציאת ה[[עקומה|עקום]] בעלבעלת האורך המינימלי בין שתי נקודות, אשר נקראהנקראת [[גאודיזהמסילה גאודזית]]. ב[[מרחב אוקלידי]] הפתרון הוא קו [[ישר]], אבל אם יש מגבלות על הפתרון, למשל שהקו יימצא על [[משטח (טופולוגיה)|משטח]] כלשהו, הפתרון פחות ברור מאליו. בעיה קשורה היא [[עיקרוןעקרון פרמה]] ב[[אופטיקה]]: ה[[אור]] עובר במסלולים בעלי מסלול אופטי מינימלי בין שתי נקודות (המסלול האופטי תלוי ב[[תווך]]). עיקרון קשור ב[[מכניקה]] הוא עקרון הפעולה המינימליתהמינימאלית.
 
בעיות חשובות רבות עוסקות בפונקציות בעלות [[משתנה|משתנים]] מרובים. פתרון בעיות עם [[תנאי שפה]] ל[[משוואת לפלס]] מקיימות את [[עיקרוןעקרון שובך היונים|עקרון דיריכלה]]. [[בעיית פלטיאו]] דורשת מציאת משטח בעל שטח מינימלי אשר עובר במתאר נתון במרחב. הפתרון לבעיה זו קשור לאופן היווצרות [[בועת סבון|בועות סבון]] בעת טבילת מסגרת ברזל במי [[סבון]]. אף על פי ש[[ניסוי|ניסויים]] כאלו הם קלים לביצוע, התיאור המתמטי שלהם לעיתים סבוך: ישנם כמה פתרונות אפשריים ויכולה להיות להם [[טופולוגיה]] לא -טריוויאלית.
 
==אופי הבעיה==
 
נביא את הבעיה המתמטית לצורה הבאה:
:<math display=block>\begin{align}S=&\int\limits_{x_1}^{x_2}L\left[y(x),\frac{\part y}{\part x},x\right]dx\\&\begin{cases}y(x_1)=y_1\\y(x_2)=y_2\end{cases}\end{align}</math>
 
<center><math>\ S=\int_{x_1}^{x_2} L\left[ y(x),\frac{\partial y}{\partial x},x \right] \, \mathrm{d}x</math></center>
עם תנאי השפה:<center>
<math>\begin{cases} y(x_1)=y_1 \\ y(x_2)=y_2 \end{cases}</math></center>
 
מטרתנו היא למצוא את הפונקציה <math>y(x)</math> אשר תביא את הפונקציונל לאקסטרמום.
 
מציאת הפונקציה המבוקשת מתבצעת על ידי פתרון [[משוואת אוילר־לגראנזאוילר-לגראנז']]:
:<math display="block">\frac{\mathrm{d}part L}{\mathrmpart y}-\frac{d}x{dx}\left[\frac{\partialpart L}{\partial \left(\frac{\partialpart y}{\partial x}\right)'}\right]-\frac{ \partial L}{\partial y}=0</math>
 
==דריבציהחישוב==
נניח שקיים אקסטרמום לפונקציונל ושהפונקציה אשר מביאה אליו היא <math>y_0(x)</math>. נוכל לבטא כל פונקציה בצורה <math>y(x)=y_0(x)+\epsilon \times \eta (x)</math>
 
נוכל לבטא כל פונקציה בצורה <math>y(x)=y_0(x)+\epsilon\cdot\eta(x)</math>, כאשר <math>\eta(x)</math> פונקציה כלשהיא ובעלת תנאי השפה <math>\eta(x_1)=\eta(x_2)=0</math>, כך ש־<math>y(x)</math> מקיימת את תנאי השפה ו־<math>\epsilon</math> מספר ממשי כלשהוא.
כאשר <math>\eta (x)</math> היא פונקציה כלשהי ובעלת תנאי השפה
 
נשים לב שתחת הנחותינו מתקיים: <math>S = S \leftbigl( \eta (Xx),\frac{\mathrm{d}\eta}{\mathrm{d}'(x}),\epsilon \rightbigr)</math> ויותר מכך, מתקיים: <math>\frac{dS}{d\epsilon}\Bigg|_{\epsilon =0}=0</math>.
<math>\eta (x_1)=\eta (x_2)=0</math>,
 
כך ש<math>y(x)</math>
מקיימת את תנאי השפה,
 
ו-<math>\epsilon</math> הוא מספר ממשי כלשהו.
 
נשים לב שתחת הנחותינו מתקיים <math>S = S \left( \eta (X),\frac{\mathrm{d}\eta}{\mathrm{d}x},\epsilon \right)</math> ויותר מכך, מתקיים <math>\frac{dS}{d\epsilon}_{\epsilon =0}=0</math>.
 
נפתח את הביטוי למקסימה של הפונקציונל:
:<math>\frac{\mathrm{d}SdS}{\mathrm{d}\epsilon}\Bigg|_{\epsilon =0}=\frac{\partialpart S}{\partialpart y}\Bigg|_{\epsilon =0}\cdot\frac{\partialpart y}{\partial part\epsilon}+\frac{\partialpart S}{\partialpart \frac{\mathrm{d}y'}{\mathrm{d}x}}Bigg|_{\epsilon =0}\cdot\frac{\partialpart y'}{\part\epsilon}=\frac{\mathrm{d}ypart S}{\mathrmpart y_0}\cdot\eta+\frac{d}x}\part S}{\partialpart y_0'}\epsiloncdot\frac{d\eta}={dx}</math>
 
מכיוון שגבולות האינטגרל בפונקציונל אינם תלויים ב־<math>\epsilon</math> נוכל להחליף את סדר הגזירה והאינטגרציה. לאחר מכן נשתמש באינטגרציה בחלקים ונקבל:
<math>\frac{\mathrm{d}S}{\mathrm{d}\epsilon}_{\epsilon =0}=\frac{\partial S}{\partial y}_{\epsilon =0}\cdot\frac{\partial y}{\partial \epsilon}+\frac{\partial S}{\partial \frac{\mathrm{d}y}{\mathrm{d}x}}_{\epsilon =0}\cdot\frac{\partial \frac{\mathrm{d}y}{\mathrm{d}x}}{\partial \epsilon}=
:<math>\frac{dS}{d\epsilon}\Bigg|_{\epsilon=0}=\int\limits_{x_1}^{x_2}\left(\frac{\part L}{\part y_0}\cdot\eta+\frac{\part L}{\part y_0'}\cdot\frac{d\eta}{dx}\right)dx=\int\limits_{x_1}^{x_2}\left(\frac{\part L}{\part y_0}-\frac{d}{dx}\left[\frac{\part L}{\part y_0'}\right]\right)\eta\,dx+\frac{d}{dx}\left[\frac{\part L}{\part y_0'}\right]\cdot\eta\,\Bigg|_{x_1}^{x_2}</math>
\frac{\partial S}{\partial y_0}\cdot\eta+\frac{\partial S}{\partial \frac{\mathrm{d}y_0}{\mathrm{d}x}}\cdot\frac{\mathrm{d}\eta}{\mathrm{d}x}
נזכור כי <math>\eta</math> מתאפסת בנקודות הקצה ולכן האבר האחרון מתאפס. נקבל:
</math>.
<math>\frac{dS}{d\epsilon}\Bigg|_{\epsilon=0}=\int\limits_{x_1}^{x_2}\left(\frac{\part L}{\part y_0}-\frac{d}{dx}\left[\frac{\part L}{\part y_0'}\right]\right)\eta\,dx=0</math>
 
נשים לב כי גבולות האינטגרל שרירותיים, ולכן האינטגרנטהאינטגרנד חייב להתאפס. מכיוון שη היאש־<math>\eta</math> פונקציה שרירותית ובאופן כללי שונה מפונקציית האפס, נקבל כי: <math> \frac{\partial L}{\partial y}-\frac{\mathrm{d}}{\mathrm{d}x}\frac{\partial L}{\partial \frac{\mathrm{d}y}{\mathrm{d}x}}=0</math> וזו ידועה כ[[משוואת אוילר־לגראנז']].
מכיוון שגבולות האינטגרל בפונקציונל אינם תלויים ב-<math>\epsilon
:<math display="block">\frac{\part T=L}{\intpart y}-\frac{\sqrtd}{1+dx}\left([\frac{\mathrm{d}ypart L}{\mathrm{d}xpart y'}\right)^2}}{ \sqrt{-2gy(x)}}\, \mathrm{d}x]=0</math>
</math> נוכל להחליף את סדר הגזירה והאינטגרציה. לאחר מכן נשתמש באינטגרציה בחלקים ונקבל:
 
<math>\frac{\mathrm{d}S}{\mathrm{d}\epsilon}_{\epsilon =0}=
\int_{x_1}^{x_2} \frac{\partial L}{\partial y_0}\cdot\eta+\frac{\partial L}{\partial \frac{\mathrm{d}y_0}{\mathrm{d}x}}\cdot\frac{\mathrm{d}\eta}{\mathrm{d}x} \, \mathrm{d}x=
\int_{x_1}^{x_2} \left(\frac{\partial L}{\partial y_0}-\frac{\mathrm{d}}{\mathrm{d}x}\frac{\partial L}{\partial \frac{\mathrm{d}y_0}{\mathrm{d}x}} \right)\cdot\eta \, \mathrm{d}x+\frac{\mathrm{d}}{\mathrm{d}x}\frac{\partial L}{\partial \frac{\mathrm{d}y_0}{\mathrm{d}x}}\cdot\eta |_{x_1}^{x_2}
 
</math>.
 
נזכור כי בנקודות הקצה הפונקציה השרירותית מתאפסת ולכן האיבר האחרון מתאפס. נקבל: <math>\frac{\mathrm{d}S}{\mathrm{d}\epsilon}_{\epsilon =0} =\int_{x_1}^{x_2} \left(\frac{\partial L}{\partial y_0}-\frac{\mathrm{d}}{\mathrm{d}x}\frac{\partial L}{\partial \frac{\mathrm{d}y_0}{\mathrm{d}x}}\right)\cdot\eta \, \mathrm{d}x=0</math>
 
נשים לב כי גבולות האינטגרל שרירותיים, ולכן האינטגרנט חייב להתאפס. מכיוון שη היא פונקציה שרירותית ובאופן כללי שונה מפונקציית האפס, נקבל כי: <math> \frac{\partial L}{\partial y}-\frac{\mathrm{d}}{\mathrm{d}x}\frac{\partial L}{\partial \frac{\mathrm{d}y}{\mathrm{d}x}}=0</math> וזו ידועה כ[[משוואת אוילר־לגראנז']].
 
===הכללות===
ניתן לקבל בקלות את משוואת אוילר -לגראנז' באותה שיטה גם למקרים הבאים:
 
* פונקציונל של N פונקציות <math>q_i(t)</math>
ניתן לקבל בקלות את משוואת אוילר לגראנז' באותה שיטה גם למקרים הבאים:
<math>\frac{\part L}{\part q_i}-\frac{d}{dt}\left[\frac{\part L}{\part q_i'}\right]=0</math>
* פונקציונל של N פונקציות <math>q_i(t)</math>
<math> \frac{\partial L}{\partial q_i}-\frac{d}{dt}\frac{\partial L}{\partial \frac{dq_i}{dt}}=0</math>. זהו סט שלקבוצת <math>N</math> משוואות, המתקיימות לכל הפונקציות <math>q_i(t)</math>
*פונקציונל של פונקציות הפועלות על מרחב ווקטוריוקטורי <math>\xi F(\vec{r})</math>
 
:<math>\frac{d}{dx}\left[\frac{\part L}{\part\bigl(\frac{\part F}{\part x}\bigr)}\right]+\frac{d}{dy}\left[\frac{\part L}{\part\bigl(\frac{\part F}{\part y}\bigr)}\right]+\frac{d}{dz}\left[\frac{\part L}{\part\bigl(\frac{\part F}{\part z}\bigr)}\right]-\frac{\part L}{\part F}=0</math>
*פונקציונל של פונקציות הפועלות על מרחב ווקטורי <math>\xi (\vec{r})</math>
<math>\frac{\mathrm{d}}{\mathrm{d}x} \frac{\partial L}{\partial \frac{\partial \xi}{\partial x}}+
\frac{\mathrm{d}}{\mathrm{d}y} \frac{\partial L}{\partial \frac{\partial \xi}{\partial y}}+
\frac{\mathrm{d}}{\mathrm{d}z} \frac{\partial L}{\partial \frac{\partial \xi}{\partial z}}-
\frac{\partial L}{\partial \xi}=0
</math>
 
==דוגמאות==
דוגמה פשוטה לפונקציונל, מתחום ה[[אופטיקה]], היא הזמן שלוקחשאורך לקרן לעבור בין שתי נקודות דרך מסלול כלשהוכלשהוא במרחב. המסלול במקרה זה מיוצג על ידי <math>\vec{f}(s)=\bigl( x(s),y(s),z(s)\bigr)</math> כאשר <math>(x,y,z)</math> הן קואורדינטות ו-ו־<math>\ s</math> הוא פרמטר כלשהוכלשהוא המגדיר את המיקום לאורך המסלול, למשל [[אורך הקשת]] או הקואורדינטה לאורך אחד הצירים. לכן אם מהירות הגל בנקודה <math>\vec{r}=(x,y,z)</math> במרחב היא <math>c(\vec{r})</math>, ו-ו־<math>\,s</math> מיצג את אורך הקשת, אזי זמן המעבר, <math>T</math>, בין שתי הנקודות נתון בביטוי:
:<math display="block">T = \int \frac{\mathrm{d}sds}{c(\vec{r}(s))}</math>
מכאן ברור שכל מסלול של הקרן נותן, בדרך כלל, ערך שונה של זמן המעבר <math>T</math>, וחשבון הווריאציות מאפשר לנו לחשב מהו המסלול עבורו זמן המעבר מינימלי (או באופן מדויק יותר אקסטרמלי), כשם שפעולת הנגזרת מאפשרת למצוא את נקודות האקסטרמום של הפונקציה. לפי [[עקרון פרמה]] המסלולים בהם הקרן אמנם עוברת הם המסלולים עבורם <math>T</math> מינימלי, ולכן חשבון הווריאציות הוא הדרך לחישוב המסלולים של קרן אור בתווך כלשהוכלשהוא.
 
דוגמה נוספת, אשר הייתההיתה אחד הזרזים להתפתחות התחום, היא [[בעיית הברכיסטוכרון]] (המושג"הזמן ברכיסטוכרון נגזר מהמילה היוונית ברכיסטוס שפרושה "הקצר ביותר"). הבעיה מוגדרת באופן הבא:
דוגמה פשוטה לפונקציונל, מתחום ה[[אופטיקה]], היא הזמן שלוקח לקרן לעבור בין שתי נקודות דרך מסלול כלשהו במרחב. המסלול במקרה זה מיוצג על ידי <math>\vec{f}(s)=( x(s),y(s),z(s))</math> כאשר <math>(x,y,z)</math> הן קואורדינטות ו-<math>\ s</math> הוא פרמטר כלשהו המגדיר את המיקום לאורך המסלול, למשל [[אורך הקשת]] או הקואורדינטה לאורך אחד הצירים. לכן אם מהירות הגל בנקודה <math>\vec{r}=(x,y,z)</math> במרחב היא <math>c(\vec{r})</math>, ו-<math>\,s</math> מיצג את אורך הקשת, אזי זמן המעבר, <math>T</math>, בין שתי הנקודות נתון בביטוי:
:נתון חלקיק בשדה [[גרביטציהכבידה]] אחיד <math>g</math> בכיוון <math>\ y</math>. בהנחה שבתחילת דרכו החלקיק נמצא בראשית הצירים במנוחה, מהו המסלול <math>y(x)</math> עבורו זמן המעבר לנקודה מרוחקת (נמוכה יותר) הוא מינימלי?
 
כיוון שהקואורדינטה <math>y</math> מציינת את גובה החלקיק, אזי שימור אנרגיההאנרגיה קובע שמהירותו היא <math>v=\sqrt{-2 gy2gy} </math>. לכן פונקציונל הזמן במקרה זה הוא:
<math display="block">T = \int \frac{\mathrm{d}s}{c(\vec{r}(s))}</math>
:<math display=block>T=\int\frac{\sqrt{1+y'(x)^2}}{\sqrt{-2gy(x)}}\,dx</math>
 
מכאן ברור שכל מסלול של הקרן נותן, בדרך כלל, ערך שונה של זמן המעבר <math>T</math>, וחשבון הווריאציות מאפשר לנו לחשב מהו המסלול עבורו זמן המעבר מינימלי (או באופן מדויק יותר אקסטרמלי), כשם שפעולת הנגזרת מאפשרת למצוא את נקודות האקסטרמום של הפונקציה. לפי [[עקרון פרמה]] המסלולים בהם הקרן אמנם עוברת הם המסלולים עבורם <math>T</math> מינימלי, ולכן חשבון הווריאציות הוא הדרך לחישוב המסלולים של קרן אור בתווך כלשהו.
 
דוגמה נוספת, אשר הייתה אחד הזרזים להתפתחות התחום, היא [[בעיית הברכיסטוכרון]] (המושג ברכיסטוכרון נגזר מהמילה היוונית ברכיסטוס שפרושה "הקצר ביותר"). הבעיה מוגדרת באופן הבא:
:נתון חלקיק בשדה [[גרביטציה]] אחיד <math>g</math> בכיוון <math>\ y</math>. בהנחה שבתחילת דרכו החלקיק נמצא בראשית הצירים במנוחה, מהו המסלול <math>y(x)</math> עבורו זמן המעבר לנקודה מרוחקת (נמוכה יותר) הוא מינימלי?
כיוון שהקואורדינטה <math>y</math> מציינת את גובה החלקיק, אזי שימור אנרגיה קובע שמהירותו היא <math>v=\sqrt{-2 gy} </math>. לכן פונקציונל הזמן במקרה זה הוא:
 
<math display="block">\ T=\int \frac{\sqrt{1+\left(\frac{\mathrm{d}y}{\mathrm{d}x}\right)^2}}{ \sqrt{-2gy(x)}}\, \mathrm{d}x</math>
 
==קישורים חיצוניים==