בעיית בזל היא בעיה מפורסמת באנליזה מתמטית , שהוצגה לראשונה בשנת 1644 על ידי פייטרו מנגולי , ונפתרה על ידי לאונרד אוילר בשנת 1735 . כיוון שהבעיה נשארה לא פתורה לנוכח ניסיונות מתמשכים של המתמטיקאים המובילים באותה תקופה, פרסום פתרונו של אוילר, כאשר היה בן 28, הביא לו תהילה מיידית. אוילר הכליל את הבעיה באמצעות פונקציית זטא ופתר את הבעיה הכללית, ורעיונותיו שימשו השראה לברנהרד רימן , אשר בעבודתו משנת 1859 השתמש בפונקציה בהקשר למשפט המספרים הראשוניים . הבעיה נקראת על שם בזל , עירו של אוילר כמו גם של בני משפחת ברנולי , שלא הצליחו לפתור את הבעיה.
בעיית בזל היא מציאת סכום הטור האינסופי של הערכים ההופכיים של ריבועי מספרים הטבעיים . כלומר הסכום:
∑
n
=
1
∞
1
n
2
=
1
+
1
2
2
+
1
3
2
+
1
4
2
+
⋯
{\displaystyle \sum _{n=1}^{\infty }{\frac {1}{n^{2}}}=1+{\frac {1}{2^{2}}}+{\frac {1}{3^{2}}}+{\frac {1}{4^{2}}}+\cdots }
סכום טור זה שווה בקירוב ל-1.644934. בעיית בזל דורשת את הערך המדויק של סכום הטור. אוילר הוכיח שהסכום המדויק הוא
π
2
6
{\displaystyle \,{\frac {\pi ^{2}}{6}}}
ופרסם את התגלית הזו בשנת 1735. ההוכחה שלו התבססה על שיטות שלא נראו עד אז.
פתרונו של אוילר לבעיה נחשב מקורי ומבריק. הוא תקף את הבעיה מנקודת מבט שונה לגמרי ממה שנראה עד אז. טיעונו של אוילר הוא כזה: נפתח את טור טיילור של הפונקציה
sin
x
{\displaystyle \ \sin x}
ונקבל:
sin
x
=
x
−
x
3
3
!
+
x
5
5
!
−
x
7
7
!
+
…
{\displaystyle \,\sin x=x-{\frac {x^{3}}{3!}}+{\frac {x^{5}}{5!}}-{\frac {x^{7}}{7!}}+\dots }
נחלק ב-x ונקבל:
sin
x
x
=
1
−
x
2
3
!
+
x
4
5
!
−
x
6
7
!
+
…
{\displaystyle \,{\frac {\sin x}{x}}=1-{\frac {x^{2}}{3!}}+{\frac {x^{4}}{5!}}-{\frac {x^{6}}{7!}}+\dots }
כעת, פונקציה זו מתאפסת בנקודות מהצורה
n
⋅
π
{\displaystyle \,n\cdot \pi }
כאשר
n
=
±
1
,
±
2
,
±
3
…
{\displaystyle \,n=\pm 1,\pm 2,\pm 3\dots }
. נניח, לפיכך, כי ניתן, בדומה לפולינומים להביע את
sin
x
/
x
{\displaystyle \,\sin x/x}
כמכפלת האפסים שלה:
sin
(
x
)
x
=
(
1
−
x
π
)
(
1
+
x
π
)
(
1
−
x
2
π
)
(
1
+
x
2
π
)
(
1
−
x
3
π
)
(
1
+
x
3
π
)
⋯
{\displaystyle {\frac {\sin(x)}{x}}=\left(1-{\frac {x}{\pi }}\right)\left(1+{\frac {x}{\pi }}\right)\left(1-{\frac {x}{2\pi }}\right)\left(1+{\frac {x}{2\pi }}\right)\left(1-{\frac {x}{3\pi }}\right)\left(1+{\frac {x}{3\pi }}\right)\cdots }
=
(
1
−
x
2
π
2
)
(
1
−
x
2
4
π
2
)
(
1
−
x
2
9
π
2
)
⋯
.
{\displaystyle =\left(1-{\frac {x^{2}}{\pi ^{2}}}\right)\left(1-{\frac {x^{2}}{4\pi ^{2}}}\right)\left(1-{\frac {x^{2}}{9\pi ^{2}}}\right)\cdots .}
כעת, אם נכפול בצורה פורמלית ביטוי זה, ונאסוף את המקדמים של
x
2
{\displaystyle \,x^{2}}
, נקבל כי המקדם של
x
2
{\displaystyle \,x^{2}}
ב-
sin
x
/
x
{\displaystyle \,\sin x/x}
הוא
−
(
1
π
2
+
1
4
π
2
+
1
9
π
2
+
⋯
)
=
−
1
π
2
∑
n
=
1
∞
1
n
2
.
{\displaystyle -\left({\frac {1}{\pi ^{2}}}+{\frac {1}{4\pi ^{2}}}+{\frac {1}{9\pi ^{2}}}+\cdots \right)=-{\frac {1}{\pi ^{2}}}\sum _{n=1}^{\infty }{\frac {1}{n^{2}}}.}
אך מטור טיילור של
sin
x
/
x
{\displaystyle \,\sin x/x}
, אנו יודעים כי המקדם של
x
2
{\displaystyle \,x^{2}}
הוא
−
1
/
3
!
=
−
1
/
6
{\displaystyle \,-1/3!=-1/6}
.
אך שני מקדמים אלו חייבים להיות שווים זה לזה, ולפיכך
−
1
6
=
−
1
π
2
∑
n
=
1
∞
1
n
2
.
{\displaystyle -{\frac {1}{6}}=-{\frac {1}{\pi ^{2}}}\sum _{n=1}^{\infty }{\frac {1}{n^{2}}}.}
ועל ידי הכפלת שני האגפים ב-
−
π
2
{\displaystyle -\pi ^{2}}
נקבל את הדרוש.
פתרונו של אוילר אינו ריגורוזי לחלוטין בסטנדרט המתמטי המודרני. זאת משום שלא הצדיק את ההנחה שניתן להביע את
sin
x
/
x
{\displaystyle \,\sin x/x}
כמכפלת גורמים ליניאריים המאפסים את האפסים. ביטוי זה מוצדק בדיעבד על ידי משפט הפירוק של ויירשטראס .
ג'ון ואליס גילה ב-1665 את נוסחת המכפלה שלו לפאי :
∏
n
=
1
∞
(
2
n
2
n
−
1
⋅
2
n
2
n
+
1
)
=
2
1
⋅
2
3
⋅
4
3
⋅
4
5
⋅
6
5
⋅
6
7
⋅
8
7
⋅
8
9
⋯
=
π
2
{\displaystyle \prod _{n=1}^{\infty }\left({\frac {2n}{2n-1}}\cdot {\frac {2n}{2n+1}}\right)={\frac {2}{1}}\cdot {\frac {2}{3}}\cdot {\frac {4}{3}}\cdot {\frac {4}{5}}\cdot {\frac {6}{5}}\cdot {\frac {6}{7}}\cdot {\frac {8}{7}}\cdot {\frac {8}{9}}\cdots ={\frac {\pi }{2}}}
.
וואליס גזר את המכפלה האינסופית הזאת בצורה שנעשית בטקסטים של חשבון אינפיניטסימלי כיום - באמצעות השוואת
∫
0
π
sin
n
x
d
x
{\displaystyle \scriptstyle \int _{0}^{\pi }\sin ^{n}xdx}
בעבור ערכים זוגיים ואי זוגיים של
n
{\displaystyle n}
. בדיעבד, כפי שאוילר הבחין, נוסחת המכפלה של וואליס היא מסקנה פשוטה מן השיטות שלו לפתרון בעיית בזל. נראה זאת:
sin
x
x
=
∏
n
=
1
∞
(
1
−
x
2
n
2
π
2
)
{\displaystyle {\frac {\sin x}{x}}=\prod _{n=1}^{\infty }\left(1-{\frac {x^{2}}{n^{2}\pi ^{2}}}\right)}
נציב
x
=
π
2
{\displaystyle x={\frac {\pi }{2}}}
ונקבל:
⇒
2
π
=
∏
n
=
1
∞
(
1
−
1
4
n
2
)
⇒
π
2
=
∏
n
=
1
∞
(
4
n
2
4
n
2
−
1
)
=
∏
n
=
1
∞
(
2
n
2
n
−
1
⋅
2
n
2
n
+
1
)
=
2
1
⋅
2
3
⋅
4
3
⋅
4
5
⋅
6
5
⋅
6
7
⋯
{\displaystyle {\begin{aligned}\Rightarrow {\frac {2}{\pi }}&=\prod _{n=1}^{\infty }\left(1-{\frac {1}{4n^{2}}}\right)\\\Rightarrow {\frac {\pi }{2}}&=\prod _{n=1}^{\infty }\left({\frac {4n^{2}}{4n^{2}-1}}\right)\\&=\prod _{n=1}^{\infty }\left({\frac {2n}{2n-1}}\cdot {\frac {2n}{2n+1}}\right)={\frac {2}{1}}\cdot {\frac {2}{3}}\cdot {\frac {4}{3}}\cdot {\frac {4}{5}}\cdot {\frac {6}{5}}\cdot {\frac {6}{7}}\cdots \end{aligned}}}
פתרון באמצעות אנליזה הרמונית
עריכה
את הבעיה אפשר לפתור כמקרה פרטי של טור פורייה : פיתוח פונקציה מחזורית בקטע לטור של סינוסים וקוסינוסים .
תהי
f
{\displaystyle f}
פונקציית הזהות
f
(
x
)
=
x
{\displaystyle f(x)=x}
בקטע
[
−
π
,
π
]
{\displaystyle [-\pi ,\pi ]}
. כדי שטור פורייה שלה יהיה תקף גם מחוץ לקטע זה, נצטרך להמשיך אותה באופן מחזורי. נשים לב, שבהמשכה זה הפונקציה איננה רציפה ובכל זאת קיים לה פיתוח לטור פורייה.
נחשב את מקדמי פורייה שלה. מאחר שזו פונקציה אי-זוגית נשתמש בהצגה הטריגונומטרית שלה, כי אז כל המקדמים של הקוסינוסים מתאפסים ורק מקדמי הסינוסים נשארים (זאת מאחר שהסינוס היא פונקציה אי-זוגית והקוסינוס היא פונקציה זוגית).
לכן,
a
0
=
1
2
π
∫
−
π
π
f
(
x
)
d
x
=
1
2
π
∫
−
π
π
x
d
x
=
0
{\displaystyle a_{0}={\frac {1}{2\pi }}\int _{-\pi }^{\pi }f(x)dx={\frac {1}{2\pi }}\int _{-\pi }^{\pi }xdx=0}
a
n
=
1
π
∫
−
π
π
f
(
x
)
cos
(
n
x
)
d
x
=
1
π
∫
−
π
π
x
cos
(
n
x
)
d
x
=
0
{\displaystyle a_{n}={\frac {1}{\pi }}\int _{-\pi }^{\pi }f(x)\cos(nx)dx={\frac {1}{\pi }}\int _{-\pi }^{\pi }x\cos(nx)dx=0}
כעת, נחשב את מקדמי הסינוסים:
b
n
=
1
π
∫
−
π
π
f
(
x
)
sin
(
n
x
)
d
x
=
1
π
∫
−
π
π
x
sin
(
n
x
)
d
x
=
{\displaystyle b_{n}={\frac {1}{\pi }}\int _{-\pi }^{\pi }f(x)\sin(nx)dx={\frac {1}{\pi }}\int _{-\pi }^{\pi }x\sin(nx)dx=}
=
2
π
∫
0
π
x
sin
(
n
x
)
d
x
=
2
π
(
[
−
x
cos
(
n
x
)
n
]
0
π
+
[
sin
(
n
x
)
n
2
]
0
π
)
=
(
−
1
)
n
+
1
2
n
{\displaystyle ={\frac {2}{\pi }}\int _{0}^{\pi }x\sin(nx)dx={\frac {2}{\pi }}\left(\left[-{\frac {x\cos(nx)}{n}}\right]_{0}^{\pi }+\left[{\frac {\sin(nx)}{n^{2}}}\right]_{0}^{\pi }\right)=(-1)^{n+1}{\frac {2}{n}}}
בסך הכל, טור פורייה של x הוא
f
(
x
)
=
x
=
a
0
+
∑
n
=
1
∞
(
a
n
cos
(
n
x
)
+
b
n
sin
(
n
x
)
)
=
{\displaystyle f(x)=x=a_{0}+\sum _{n=1}^{\infty }(a_{n}\cos(nx)+b_{n}\sin(nx))=}
=
∑
n
=
1
∞
(
−
1
)
n
+
1
2
n
sin
(
n
x
)
,
∀
x
∈
(
−
π
,
π
)
{\displaystyle =\sum _{n=1}^{\infty }(-1)^{n+1}{\frac {2}{n}}\sin(nx),\quad \forall x\in (-\pi ,\pi )}
כעת נשתמש בזהות פרסבל
a
0
2
4
+
1
2
∑
n
=
1
∞
(
a
n
2
+
b
n
2
)
=
1
2
π
∫
−
π
π
f
(
x
)
2
d
x
{\displaystyle {\frac {a_{0}^{2}}{4}}+{\frac {1}{2}}\sum _{n=1}^{\infty }\left(a_{n}^{2}+b_{n}^{2}\right)={\frac {1}{2\pi }}\int _{-\pi }^{\pi }f(x)^{2}dx}
.
כדי לקבל ש
1
2
∑
n
=
1
∞
4
n
2
=
1
2
π
∫
−
π
π
x
2
d
x
=
1
π
π
3
3
{\displaystyle {\frac {1}{2}}\sum _{n=1}^{\infty }{\frac {4}{n^{2}}}={\frac {1}{2\pi }}\int _{-\pi }^{\pi }x^{2}dx={\frac {1}{\pi }}{\frac {\pi ^{3}}{3}}}
נחלק ב-2 את הביטוי ונצמצם את פאי באגף הימני ונקבל
∑
n
=
1
∞
1
n
2
=
π
2
6
{\displaystyle \sum _{n=1}^{\infty }{\frac {1}{n^{2}}}={\frac {\pi ^{2}}{6}}}
כמבוקש.
בעוד שמרבית ההוכחות משתמשות בכלים מענפים מתקדמים במתמטיקה כגון אנליזת פורייה , אנליזה מרוכבת או חשבון אינפיניטסימלי , ההוכחה שתוצג בהמשך אינה עושה שימוש כלל בחשבון אינפיניטסימלי, למעט שימוש בגבול בסוף ההוכחה.
הוכחה זו נמצאה על ידי קושי ב-1821 ופורסמה מחדש ב-1954 על ידי עקיבה ויצחק יגלום בספרם "Nonelementary Problems in an Elementary Exposition".
רעיון ההוכחה הוא לתת חסם עליון וחסם תחתון לסכומים החלקיים
∑
j
=
1
m
1
j
2
{\displaystyle \sum _{j=1}^{m}{\frac {1}{j^{2}}}}
, כפונקציות של
m
{\displaystyle m}
, כך שהן החסם העליון והן החסם התחתון שואפים ל-
π
2
6
{\displaystyle {\frac {\pi ^{2}}{6}}}
. בדרך זו ניתן לסיים את ההוכחה באמצעות כלל הסנדוויץ' .
יהי
x
{\displaystyle x}
מספר ממשי המקיים
0
<
x
<
π
2
{\displaystyle 0<x<{\frac {\pi }{2}}}
, ויהי
n
{\displaystyle n}
שלם חיובי אי-זוגי. על פי משפט דה מואבר והגדרת הקוטנגנס מתקיימת הנוסחה
cos
(
n
x
)
+
i
sin
(
n
x
)
sin
n
x
=
(
cos
x
+
i
sin
x
)
n
sin
n
x
=
(
cos
x
+
i
sin
x
sin
x
)
n
=
(
cot
x
+
i
)
n
.
{\displaystyle {\begin{aligned}{\frac {\cos(nx)+i\sin(nx)}{\sin ^{n}x}}&={\frac {(\cos x+i\sin x)^{n}}{\sin ^{n}x}}\\&=\left({\frac {\cos x+i\sin x}{\sin x}}\right)^{n}\\&=(\cot x+i)^{n}.\end{aligned}}}
על פי הבינום של ניוטון מתקיים
(
cot
x
+
i
)
n
=
∑
k
=
0
n
(
n
k
)
(
cot
x
)
n
−
k
i
k
.
{\displaystyle (\cot x+i)^{n}=\sum _{k=0}^{n}{\binom {n}{k}}(\cot x)^{n-k}i^{k}.}
נסמן
n
=
2
m
+
1
{\displaystyle n=2m+1}
. אם נשווה את החלק המדומה של שתי התוצאות הנ"ל, נקבל את הזהות
sin
(
(
2
m
+
1
)
x
)
sin
2
m
+
1
x
=
∑
k
=
0
m
(
−
1
)
k
(
2
m
+
1
2
k
+
1
)
(
cot
x
)
2
m
−
2
k
.
{\displaystyle {\frac {\sin((2m+1)x)}{\sin ^{2m+1}x}}=\sum _{k=0}^{m}(-1)^{k}{\binom {2m+1}{2k+1}}(\cot x)^{2m-2k}.}
הצבת
x
=
j
π
2
m
+
1
{\displaystyle x={\frac {j\pi }{2m+1}}}
כאשר
1
≤
j
≤
m
{\displaystyle 1\leq j\leq m}
מאפסת את אגף שמאל, ולכן גם את אגף ימין. בנוסף, פונקציית הקוטנגנס חיובית ויורדת ממש בקטע
(
0
,
π
2
)
{\displaystyle \left(0,{\frac {\pi }{2}}\right)}
. לפיכך, לפולינום
p
(
t
)
=
∑
k
=
0
m
(
−
1
)
k
(
2
m
+
1
2
k
+
1
)
t
m
−
k
{\displaystyle p(t)=\sum _{k=0}^{m}(-1)^{k}{\binom {2m+1}{2k+1}}t^{m-k}}
יש
m
{\displaystyle m}
שורשים שונים והם
{
cot
2
j
π
2
m
+
1
}
j
=
1
m
{\displaystyle \left\{\cot ^{2}{\frac {j\pi }{2m+1}}\right\}_{j=1}^{m}}
. על פי נוסחאות ויאטה נקבל את הזהות
∑
j
=
1
m
cot
2
j
π
2
m
+
1
=
(
2
m
+
1
3
)
(
2
m
+
1
1
)
=
2
m
(
2
m
−
1
)
6
.
{\displaystyle \sum _{j=1}^{m}\cot ^{2}{\frac {j\pi }{2m+1}}={\frac {\binom {2m+1}{3}}{\binom {2m+1}{1}}}={\frac {2m(2m-1)}{6}}.}
על פי הזהות
cot
2
x
+
1
=
csc
2
x
{\displaystyle \cot ^{2}x+1=\csc ^{2}x}
נקבל כי
∑
j
=
1
m
csc
2
j
π
2
m
+
1
=
∑
j
=
1
m
(
cot
2
j
π
2
m
+
1
+
1
)
=
2
m
(
2
m
−
1
)
6
+
m
=
2
m
(
2
m
+
2
)
6
.
{\displaystyle \sum _{j=1}^{m}\csc ^{2}{\frac {j\pi }{2m+1}}=\sum _{j=1}^{m}\left(\cot ^{2}{\frac {j\pi }{2m+1}}+1\right)={\frac {2m(2m-1)}{6}}+m={\frac {2m(2m+2)}{6}}.}
לכל
x
∈
(
0
,
π
2
)
{\displaystyle x\in \left(0,{\frac {\pi }{2}}\right)}
ממשי מתקיים אי השוויון
sin
x
<
x
<
tan
x
{\displaystyle \sin x<x<\tan x}
(להוכחה, ראו כאן ). לאחר היפוך, שינוי כיוון והעלאה בריבוע נקבל את אי השוויון
cot
2
x
<
1
x
2
<
csc
2
x
.
{\displaystyle \cot ^{2}x<{\frac {1}{x^{2}}}<\csc ^{2}x.}
מכאן נקבל כי
2
m
(
2
m
−
1
)
6
=
∑
j
=
1
m
cot
2
j
π
2
m
+
1
<
∑
j
=
1
m
(
2
m
+
1
j
π
)
2
<
∑
j
=
1
m
csc
2
j
π
2
m
+
1
=
2
m
(
2
m
+
2
)
6
.
{\displaystyle {\frac {2m(2m-1)}{6}}=\sum _{j=1}^{m}\cot ^{2}{\frac {j\pi }{2m+1}}<\sum _{j=1}^{m}\left({\frac {2m+1}{j\pi }}\right)^{2}<\sum _{j=1}^{m}\csc ^{2}{\frac {j\pi }{2m+1}}={\frac {2m(2m+2)}{6}}.}
לאחר כפל ב-
(
π
2
m
+
1
)
2
{\displaystyle \left({\frac {\pi }{2m+1}}\right)^{2}}
נקבל כי
π
2
6
(
2
m
2
m
+
1
)
(
2
m
−
1
2
m
+
1
)
<
∑
j
=
1
m
1
j
2
<
π
2
6
(
2
m
2
m
+
1
)
(
2
m
+
2
2
m
+
1
)
.
{\displaystyle {\frac {\pi ^{2}}{6}}\left({\frac {2m}{2m+1}}\right)\left({\frac {2m-1}{2m+1}}\right)<\sum _{j=1}^{m}{\frac {1}{j^{2}}}<{\frac {\pi ^{2}}{6}}\left({\frac {2m}{2m+1}}\right)\left({\frac {2m+2}{2m+1}}\right).}
נשים לב שהחלק השמאלי והחלק הימני שניהם שואפים ל-
π
2
6
{\displaystyle {\frac {\pi ^{2}}{6}}}
כאשר
m
{\displaystyle m}
שואף לאינסוף. לכן על פי כלל הסנדוויץ' החלק האמצעי שואף גם כן ל-
π
2
6
{\displaystyle {\frac {\pi ^{2}}{6}}}
, שזה בדיוק מה שרצינו.
ב-1993 מצא קאלאבי (אנ' ) הוכחה קצרצרה למשפט של אוילר [1] , שאפשר להכליל לחישוב ערכים נוספים של פונקציית זטא. ההוכחה משתמשת בהחלפת משתנים דו-ממדית, כלדקמן.
נסמן ב-
S
{\displaystyle S}
את ריבוע היחידה
[
0
,
1
]
×
[
0
,
1
]
{\displaystyle [0,1]\times [0,1]}
וב-
T
{\displaystyle T}
את המשולש
{
u
,
v
∣
0
<
u
,
v
,
u
+
v
<
π
/
2
}
{\displaystyle \{u,v\mid 0<u,v,\,u+v<\pi /2\}}
.
הפונקציה
h
(
u
,
v
)
=
(
sin
u
cos
v
,
sin
v
cos
u
)
=
(
x
,
y
)
{\displaystyle \ h(u,v)=({\frac {\sin u}{\cos v}},{\frac {\sin v}{\cos u}})=(x,y)}
מעתיקה את
T
{\displaystyle T}
לפנים של
S
{\displaystyle S}
באופן חד-חד-ערכי ועל, והיעקוביאן שלה הוא
1
−
x
2
y
2
{\displaystyle 1-x^{2}y^{2}}
. לכן
π
2
8
=
∬
T
d
u
d
v
=
∬
S
(
1
−
x
2
y
2
)
−
1
d
x
d
y
=
∬
S
∑
n
=
0
∞
(
x
y
)
2
n
d
x
d
y
=
∑
n
=
0
∞
∫
0
1
x
2
n
d
x
∫
0
1
y
2
n
d
y
=
∑
n
=
0
∞
1
(
2
n
+
1
)
2
=
(
1
−
1
4
)
ζ
(
2
)
{\displaystyle {\frac {\pi ^{2}}{8}}=\iint _{T}du\,dv=\iint _{S}(1-x^{2}y^{2})^{-1}dx\,dy=\iint _{S}\sum _{n=0}^{\infty }(xy)^{2n}dx\,dy=\sum _{n=0}^{\infty }\int _{0}^{1}x^{2n}dx\int _{0}^{1}y^{2n}dy=\sum _{n=0}^{\infty }{\frac {1}{(2n+1)^{2}}}=(1-{\frac {1}{4}})\zeta (2)}
.