הגרסה הראשונה של האי־שוויון, אותה גילה אוגוסטין קושי ב־1821 , קובעת כי
a
1
b
1
+
⋯
+
a
n
b
n
≤
a
1
2
+
⋯
+
a
n
2
b
1
2
+
⋯
+
b
n
2
{\displaystyle a_{1}b_{1}+\cdots +a_{n}b_{n}\leq {\sqrt {a_{1}^{2}+\cdots +a_{n}^{2}}}{\sqrt {b_{1}^{2}+\cdots +b_{n}^{2}}}}
כאשר
a
1
,
…
,
a
n
,
b
1
,
…
,
b
n
{\displaystyle a_{1},\ldots ,a_{n},b_{1},\ldots ,b_{n}}
הם מספרים ממשיים . לאי־שוויון יסודי זה ידועות היום עשרות רבות של הוכחות. קושי הוכיח גם ששויון מתקיים רק כאשר הווקטורים
(
a
1
,
…
,
a
n
)
,
(
b
1
,
…
,
b
n
)
{\displaystyle (a_{1},\ldots ,a_{n}),(b_{1},\ldots ,b_{n})}
פרופורציוניים זה לזה (תלויים ליניארית).
ב־1859 הציג ויקטור יקובלביץ' בוניקובסקי (1804 –1889 ) את הגרסה האינטגרלית של האי־שוויון:
∫
a
b
f
(
x
)
g
(
x
)
d
x
≤
∫
a
b
f
(
x
)
2
d
x
∫
a
b
g
(
x
)
2
d
x
{\displaystyle \int \limits _{a}^{b}f(x)g(x)dx\leq {\sqrt {\int \limits _{a}^{b}f(x)^{2}dx}}{\sqrt {\int \limits _{a}^{b}g(x)^{2}dx}}}
בוניקובסקי לא ראה צורך בהוכחה נפרדת של האי־שוויון החדש, והסתפק בציטוט האי־שוויון של קושי.
ב־1885 הזדקק הרמן שוורץ , שישב אז באוניברסיטת גטינגן , לאי־שוויון
∬
f
⋅
g
≤
∬
f
2
∬
g
2
{\displaystyle \iint f\cdot g\leq {\sqrt {\iint f^{2}}}{\sqrt {\iint g^{2}}}}
, המשווה בין אינטגרלים כפולים . מאוחר יותר הובנו שלושה אי־שוויונות אלה כמקרים פרטיים של הגרסה הכללית יותר, התקפה בכל מרחב מכפלה פנימית (ראו להלן).
שוורץ לא הכיר את ניסוחו של בוניקובסקי, וההוכחה שהציג לאי־שוויון שלו מתאימה לכל מרחב מכפלה פנימית (הוכחה זו, הנעזרת בתכונות פשוטות של פולינום ריבועי, מובאת בהמשך). משום כך נקרא האי־שוויון הכללי אי־שוויון קושי-שוורץ .
האי־שוויון במרחבי מכפלה פנימית, ושימושים
עריכה
בצורתו המודרנית, אי־שוויון קושי-שוורץ קובע שאם
V
{\displaystyle V}
הוא מרחב מכפלה פנימית (מעל הממשיים או המרוכבים ), אז לכל
x
,
y
∈
V
{\displaystyle x,y\in V}
מתקיים
|
⟨
x
,
y
⟩
|
≤
‖
x
‖
⋅
‖
y
‖
{\displaystyle \ |\langle x,y\rangle |\leq \|x\|\cdot \|y\|}
כאשר
‖
x
‖
=
⟨
x
,
x
⟩
{\displaystyle \|x\|={\sqrt {\langle x,x\rangle }}}
הנורמה המושרית על
V
{\displaystyle V}
מן המכפלה הפנימית. שוויון ממש מתקיים אם ורק אם
x
,
y
{\displaystyle x,y}
תלויים ליניארית.
אחת התוצאות החשובות של אי־שוויון זה היא שהוא מאפשר להגדיר זווית
θ
{\displaystyle \theta }
בין שני וקטורים
x
,
y
{\displaystyle x,y}
במרחב מכפלה פנימית לפי המשוואה
cos
(
θ
)
=
⟨
x
,
y
⟩
‖
x
‖
‖
y
‖
{\displaystyle \cos(\theta )={\frac {\langle x,y\rangle }{\|x\|\|y\|}}}
, שהרי שבר זה מהווה מקדם מתאם בין
x
{\displaystyle x}
ל־
y
{\displaystyle y}
ולכן ערכו נע בין 1- ל־1. במקרה של המכפלה הפנימית הסטנדרטית במישור האוקלידי
R
2
{\displaystyle \mathbb {R} ^{2}}
או במרחב התלת־ממדי, הגדרה זו מתלכדת עם ההגדרה המקובלת של זווית.
בין המקרים הפרטיים של האי־שוויון, ניתן למצוא את הטענות
(
∑
k
=
1
n
x
k
y
k
)
2
≤
∑
k
=
1
n
x
k
2
⋅
∑
k
=
1
n
y
k
2
|
∫
f
(
x
)
g
(
x
)
¯
d
x
|
2
≤
∫
|
f
(
x
)
|
2
d
x
⋅
∫
|
g
(
x
)
|
2
d
x
{\displaystyle {\begin{matrix}\displaystyle \left(\sum _{k\,=\,1}^{n}x_{k}y_{k}\right)^{2}\leq \sum _{k\,=\,1}^{n}x_{k}^{2}\cdot \sum _{k\,=\,1}^{n}y_{k}^{2}\\\displaystyle \left|\int f(x){\overline {g(x)}}dx\right|^{2}\leq \int |f(x)|^{2}dx\cdot \int |g(x)|^{2}dx\end{matrix}}}
המתקבלות מן המקרים
V
=
R
n
,
V
=
L
2
(
X
)
{\displaystyle V=\mathbb {R} ^{n},V=L^{2}(X)}
(המרחב L2 ) עם המכפלה הפנימית הסטנדרטית בכל מקרה.
אם אחד הווקטורים שווה ל־0, האי־שוויון מתקיים באופן טריוויאלי כי שני האגפים שווים לאפס. לכן נניח כי
x
,
y
≠
0
{\displaystyle x,y\neq 0}
.
כעת יהי
λ
∈
R
{\displaystyle \lambda \in \mathbb {R} }
. ההוכחה מתאימה גם למקרה שבו מרחב המכפלה הפנימית
V
{\displaystyle V}
הוא מרחב וקטורי ממשי, וגם למקרה שבו הוא מרוכב.
נפתח את הביטוי
‖
x
+
λ
⟨
x
,
y
⟩
y
‖
2
{\displaystyle \|x+\lambda \langle x,y\rangle y\|^{2}}
. פיתוח ביטוי זה יתן לנו משוואה ריבועית ב־
λ
{\displaystyle \lambda }
, ומכיוון שאנו יודעים שערך הביטוי אי־שלילי, נוכל להסיק מכך שהדיסקרימיננטה של המשוואה הריבועית אי־חיובית. מהאי־שוויון המתקבל נקבל את אי־שוויון קושי-שוורץ.
0
≤
‖
x
+
λ
⟨
x
,
y
⟩
y
‖
2
=
⟨
x
+
λ
⟨
x
,
y
⟩
y
,
x
+
λ
⟨
x
,
y
⟩
y
⟩
=
⟨
x
,
x
⟩
+
λ
⟨
x
,
y
⟩
¯
⟨
x
,
y
⟩
+
λ
⟨
x
,
y
⟩
⟨
y
,
x
⟩
+
λ
2
|
⟨
x
,
y
⟩
|
2
⟨
y
,
y
⟩
=
‖
x
‖
2
+
λ
⟨
x
,
y
⟩
¯
⟨
x
,
y
⟩
+
λ
⟨
x
,
y
⟩
⟨
x
,
y
⟩
¯
+
λ
2
|
⟨
x
,
y
⟩
|
2
‖
y
‖
2
=
λ
2
|
⟨
x
,
y
⟩
|
2
‖
y
‖
2
+
2
|
⟨
x
,
y
⟩
|
2
λ
+
‖
x
‖
2
{\displaystyle {\begin{aligned}0&\leq {\Big \|}x+\lambda \langle x,y\rangle y{\Big \|}^{2}\\&={\Big \langle }x+\lambda \langle x,y\rangle y,x+\lambda \langle x,y\rangle y{\Big \rangle }\\&=\langle x,x\rangle +{\overline {\lambda \langle x,y\rangle }}\langle x,y\rangle +\lambda \langle x,y\rangle \langle y,x\rangle +\lambda ^{2}|\langle x,y\rangle |^{2}\langle y,y\rangle \\&=\|x\|^{2}+\lambda {\overline {\langle x,y\rangle }}\langle x,y\rangle +\lambda \langle x,y\rangle {\overline {\langle x,y\rangle }}+\lambda ^{2}|\langle x,y\rangle |^{2}\|y\|^{2}\\&=\lambda ^{2}|\langle x,y\rangle |^{2}\|y\|^{2}+2|\langle x,y\rangle |^{2}\lambda +\|x\|^{2}\end{aligned}}}
הפרבולה המיוצגת על ידי המשוואה נוגעת בציר X לכל היותר אך אינה עוברת מתחתיו, ולכן יש למשוואה פתרון אחד לכל היותר. על כן נקבל מחישוב הדיסקרימיננטה:
4
|
⟨
x
,
y
⟩
|
4
−
4
|
⟨
x
,
y
⟩
|
2
‖
x
‖
2
‖
y
‖
2
≤
0
{\displaystyle 4|\langle x,y\rangle |^{4}-4|\langle x,y\rangle |^{2}\|x\|^{2}\|y\|^{2}\leq 0}
.
אם
⟨
x
,
y
⟩
=
0
{\displaystyle \langle x,y\rangle =0}
האי־שוויון מתקיים באופן טריוויאלי (כי אגף ימין בו תמיד חיובי או אפס). לכן נניח כי
⟨
x
,
y
⟩
≠
0
{\displaystyle \langle x,y\rangle \neq 0}
, ולאחר העברת אגפים וחלוקה ב־
4
|
⟨
x
,
y
⟩
|
2
{\displaystyle 4|\langle x,y\rangle |^{2}}
נקבל:
|
⟨
x
,
y
⟩
|
2
≤
‖
x
‖
2
‖
y
‖
2
{\displaystyle |\langle x,y\rangle |^{2}\leq \|x\|^{2}\|y\|^{2}}
הוצאת שורש ריבועי משני האגפים נותנת לנו את אי־שוויון קושי-שוורץ.
יהיו
x
,
y
∈
V
{\displaystyle \ x,y\in V}
שני וקטורים במרחב מכפלה פנימית, ונוכיח את אי-השוויון. אם
x
=
0
{\displaystyle \ x=0}
או
y
=
0
{\displaystyle \ y=0}
, ברור כי מתקיים שוויון. נניח מעתה
x
≠
0
{\displaystyle \ x\neq 0}
וכן
y
≠
0
{\displaystyle \ y\neq 0}
. נגדיר את הווקטור
u
{\displaystyle \ u}
באופן הבא:
u
=
x
−
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
{\displaystyle u=x-{\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}}}
. נשים לב כי
u
{\displaystyle \ u}
ניצב ל-
y
{\displaystyle \ y}
: שני וקטורים הם ניצבים אם ורק אם המכפלה הפנימית ביניהם היא אפס. במקרה זה:
⟨
u
,
y
⟩
=
⟨
x
−
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
,
y
⟩
=
⟨
x
,
y
⟩
−
⟨
x
,
y
⟩
⋅
⟨
y
,
y
⟩
‖
y
‖
2
=
{\displaystyle \left\langle u,y\right\rangle =\left\langle x-{\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}},y\right\rangle =\left\langle x,y\right\rangle -{\frac {\langle x,y\rangle \cdot \langle y,y\rangle }{\|y\|^{2}}}=}
=
⟨
x
,
y
⟩
−
⟨
x
,
y
⟩
⋅
‖
y
‖
2
‖
y
‖
2
=
⟨
x
,
y
⟩
−
⟨
x
,
y
⟩
=
0
{\displaystyle =\left\langle x,y\right\rangle -{\frac {\langle x,y\rangle \cdot \|y\|^{2}}{\|y\|^{2}}}=\left\langle x,y\right\rangle -\langle x,y\rangle =0}
מכאן, נחשב את
‖
u
‖
2
=
⟨
u
,
u
⟩
{\displaystyle \|u\|^{2}=\left\langle u,u\right\rangle }
:
⟨
u
,
u
⟩
=
⟨
u
,
x
−
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
⟩
=
⟨
u
,
x
⟩
−
⟨
u
,
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
⟩
=
{\displaystyle \left\langle u,u\right\rangle =\left\langle u,x-{\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}}\right\rangle =\left\langle u,x\right\rangle -\left\langle u,{\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}}\right\rangle =}
=
⟨
u
,
x
⟩
−
⟨
x
,
y
⟩
¯
⋅
⟨
u
,
y
⟩
‖
y
‖
2
=
⟨
u
,
x
⟩
{\displaystyle \quad =\left\langle u,x\right\rangle -{\frac {{\overline {\langle x,y\rangle }}\cdot \left\langle u,y\right\rangle }{\|y\|^{2}}}=\left\langle u,x\right\rangle }
ומכאן:
⟨
u
,
u
⟩
=
⟨
u
,
x
⟩
=
⟨
x
−
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
,
x
⟩
=
⟨
x
,
x
⟩
−
⟨
⟨
x
,
y
⟩
⋅
y
‖
y
‖
2
,
x
⟩
=
{\displaystyle \left\langle u,u\right\rangle =\left\langle u,x\right\rangle =\left\langle x-{\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}},x\right\rangle =\left\langle x,x\right\rangle -\left\langle {\frac {\langle x,y\rangle \cdot y}{\|y\|^{2}}},x\right\rangle =}
=
⟨
x
,
x
⟩
−
⟨
x
,
y
⟩
⋅
⟨
y
,
x
⟩
‖
y
‖
2
=
‖
x
‖
2
−
|
⟨
x
,
y
⟩
|
2
‖
y
‖
2
{\displaystyle =\left\langle x,x\right\rangle -{\frac {\langle x,y\rangle \cdot \left\langle y,x\right\rangle }{\|y\|^{2}}}=\left\|x\right\|^{2}-{\frac {|\langle x,y\rangle |^{2}}{\|y\|^{2}}}}
כלומר, הראינו כי
0
≤
‖
u
‖
2
=
‖
x
‖
2
−
|
⟨
x
,
y
⟩
|
2
‖
y
‖
2
{\displaystyle 0\leq \|u\|^{2}\ =\|x\|^{2}-{\frac {|\langle x,y\rangle |^{2}}{\|y\|^{2}}}}
ומכאן:
|
⟨
x
,
y
⟩
|
2
≤
‖
x
‖
2
‖
y
‖
2
{\displaystyle |\langle x,y\rangle |^{2}\leq \|x\|^{2}\|y\|^{2}}
או
|
⟨
x
,
y
⟩
|
≤
‖
x
‖
‖
y
‖
{\displaystyle |\langle x,y\rangle |\leq \|x\|\|y\|}
.
(הוכחה זו תקפה רק עבור מרחבי מכפלה פנימיים מעל
R
{\displaystyle \ \mathbb {R} }
)
אי שוויון המשולש במרחבים נורמיים בהם הנורמה מושרית ממרחב מכפלה פנימית, נובע מאי שוויון קושי-שוורץ:
|
⟨
x
,
y
⟩
|
≤
‖
x
‖
‖
y
‖
{\displaystyle |\langle x,y\rangle |\leq \|x\|\|y\|}
2
|
⟨
x
,
y
⟩
|
≤
2
‖
x
‖
‖
y
‖
{\displaystyle 2|\langle x,y\rangle |\leq 2\|x\|\|y\|}
‖
x
‖
2
+
2
|
⟨
x
,
y
⟩
|
+
‖
y
‖
2
≤
‖
x
‖
2
+
2
‖
x
‖
‖
y
‖
+
‖
y
‖
2
=
(
‖
x
‖
+
‖
y
‖
)
2
{\displaystyle \|x\|^{2}+2|\langle x,y\rangle |+\|y\|^{2}\leq \|x\|^{2}+2\|x\|\|y\|+\|y\|^{2}=(\|x\|+\|y\|)^{2}}
לפי הגדרת הנורמה במרחבי מכפלה פנימית:
‖
x
+
y
‖
2
=
⟨
x
+
y
,
x
+
y
⟩
{\displaystyle \ {\|x+y\|}^{2}=\langle {x+y},{x+y}\rangle }
נפתח את הביטוי על ידי שימוש בתכונות המכפלה הפנימית ונקבל:
⟨
x
+
y
,
x
+
y
⟩
=
⟨
x
,
x
⟩
+
⟨
x
,
y
⟩
+
⟨
y
,
x
⟩
+
⟨
y
,
y
⟩
=
‖
x
‖
2
+
⟨
x
,
y
⟩
+
⟨
x
,
y
⟩
¯
+
‖
y
‖
2
{\displaystyle \langle {x+y},{x+y}\rangle =\langle x,x\rangle +\langle x,y\rangle +\langle y,x\rangle +\langle y,y\rangle =\|x\|^{2}+\langle x,y\rangle +{\overline {\langle x,y\rangle }}+\|y\|^{2}}
=
‖
x
‖
2
+
2
R
e
⟨
x
,
y
⟩
+
‖
y
‖
2
≤
‖
x
‖
2
+
2
|
⟨
x
,
y
⟩
|
+
‖
y
‖
2
{\displaystyle \quad =\|x\|^{2}+2Re\langle x,y\rangle +\|y\|^{2}\leq \|x\|^{2}+2|\langle x,y\rangle |+\|y\|^{2}}
‖
x
+
y
‖
2
≤
‖
x
‖
2
+
2
|
⟨
x
,
y
⟩
|
+
‖
y
‖
2
≤
(
‖
x
‖
+
‖
y
‖
)
2
{\displaystyle \ {\|x+y\|}^{2}\leq \|x\|^{2}+2|\langle x,y\rangle |+\|y\|^{2}\leq {(\|x\|+\|y\|)}^{2}}
בשני האגפים מופיע מספר אי-שלילי שהועלה בריבוע, ולכן ניתן להוציא שורש:
‖
x
+
y
‖
≤
‖
x
‖
+
‖
y
‖
{\displaystyle \ \|x+y\|\leq \|x\|+\|y\|}