Неравенство Йенсена обобщает утверждение, что хорда к графику выпуклой функции находится над графиком.
Нера́венство Йе́нсена — неравенство , связанное с понятием выпуклой функции .
Формулировки
Сумматорный вариант неравенства
Пусть функция
f
{\displaystyle f}
является выпуклой на некотором интервале
I
{\displaystyle I}
и числа
q
1
,
q
2
,
… … -->
,
q
n
{\displaystyle \ q_{1},q_{2},\ldots ,q_{n}}
(веса) таковы, что
q
1
,
q
2
,
… … -->
,
q
n
>
0
{\displaystyle \ q_{1},q_{2},\ldots ,q_{n}>0}
и
q
1
+
q
2
+
… … -->
+
q
n
=
1
{\displaystyle \ q_{1}+q_{2}+\ldots +q_{n}=1}
.
Тогда каковы бы ни были числа
x
1
,
x
2
,
… … -->
,
x
n
{\displaystyle \ x_{1},x_{2},\ldots ,x_{n}}
из
I
{\displaystyle I}
, выполняется неравенство, известное под названием неравенства Йенсена :
f
(
q
1
x
1
+
q
2
x
2
+
… … -->
+
q
n
x
n
)
≤ ≤ -->
q
1
f
(
x
1
)
+
q
2
f
(
x
2
)
+
… … -->
+
q
n
f
(
x
n
)
,
{\displaystyle f(q_{1}x_{1}+q_{2}x_{2}+\ldots +q_{n}x_{n})\leq q_{1}f(x_{1})+q_{2}f(x_{2})+\ldots +q_{n}f(x_{n}),}
или
f
(
∑ ∑ -->
i
=
1
n
q
i
x
i
)
≤ ≤ -->
∑ ∑ -->
i
=
1
n
q
i
f
(
x
i
)
{\displaystyle f\left(\sum _{i=1}^{n}q_{i}x_{i}\right)\leq \sum _{i=1}^{n}q_{i}f(x_{i})}
.
Замечания:
Если функция
f
(
x
)
{\displaystyle \ f(x)}
вогнута (выпукла вверх), то знак в неравенстве меняется на противоположный.
Сам Иоган Йенсен исходил из более частного условия, отвечающего случаю
q
1
=
q
2
=
1
2
{\displaystyle q_{1}=q_{2}={\frac {1}{2}}}
:
f
(
x
1
+
x
2
2
)
≤ ≤ -->
f
(
x
1
)
+
f
(
x
2
)
2
{\displaystyle f\left({\frac {x_{1}+x_{2}}{2}}\right)\leq {\frac {f(x_{1})+f(x_{2})}{2}}}
.
Для непрерывных функций оно эквивалентно выпуклости.
Доказательство проводится методом математической индукции .
Для
n
=
2
{\displaystyle \ n=2}
неравенство следует из определения выпуклой функции как функции, надграфик которой является выпуклым множеством, и, следовательно, хорда, стягивающая точки
(
x
1
,
f
(
x
1
)
)
{\displaystyle (x_{1},f(x_{1}))}
и
(
x
2
,
f
(
x
2
)
)
{\displaystyle (x_{2},f(x_{2}))}
, лежит выше графика. Неравенство Йенсена означает это соотношение для точек графика и хорды, абсциссы которых равны
q
1
x
1
+
q
2
x
2
{\displaystyle q_{1}x_{1}+q_{2}x_{2}}
.
Допустим, что неравенство верно для какого-либо натурального числа
n
{\displaystyle \ n}
, докажем, что оно верно и для
n
+
1
{\displaystyle \ n+1}
, то есть
f
(
q
1
x
1
+
q
2
x
2
+
… … -->
+
q
n
x
n
+
q
n
+
1
x
n
+
1
)
≤ ≤ -->
q
1
f
(
x
1
)
+
q
2
f
(
x
2
)
+
… … -->
+
q
n
f
(
x
n
)
+
q
n
+
1
f
(
x
n
+
1
)
{\displaystyle f(q_{1}x_{1}+q_{2}x_{2}+\ldots +q_{n}x_{n}+q_{n+1}x_{n+1})\leq q_{1}f(x_{1})+q_{2}f(x_{2})+\ldots +q_{n}f(x_{n})+q_{n+1}f(x_{n+1})}
.
С этой целью, заменим слева сумму двух последних слагаемых
q
n
f
(
x
n
)
+
q
n
+
1
f
(
x
n
+
1
)
{\displaystyle \ q_{n}f(x_{n})+q_{n+1}f(x_{n+1})}
одним слагаемым
(
q
n
+
q
n
+
1
)
(
q
n
q
n
+
q
n
+
1
f
(
x
n
)
+
q
n
+
1
q
n
+
q
n
+
1
f
(
x
n
+
1
)
)
{\displaystyle (q_{n}+q_{n+1})\left({\frac {q_{n}}{q_{n}+q_{n+1}}}f(x_{n})+{\frac {q_{n+1}}{q_{n}+q_{n+1}}}f(x_{n+1})\right)}
;
это даст возможность воспользоваться неравенством для
n
{\displaystyle \ n}
и установить, что
выражение выше не превосходит суммы
q
1
f
(
x
1
)
+
q
2
f
(
x
2
)
+
… … -->
+
(
q
n
+
q
n
+
1
)
f
(
q
n
q
n
+
q
n
+
1
x
n
+
q
n
+
1
q
n
+
q
n
+
1
x
n
+
1
)
{\displaystyle q_{1}f(x_{1})+q_{2}f(x_{2})+\ldots +(q_{n}+q_{n+1})f\left({\frac {q_{n}}{q_{n}+q_{n+1}}}x_{n}+{\frac {q_{n+1}}{q_{n}+q_{n+1}}}x_{n+1}\right)}
.
Остаётся лишь применить к значению функции в последнем слагаемом неравенство для
n
=
2
{\displaystyle \ n=2}
. Таким образом по методу математической индукции неравенство Йенсена полностью доказано.
Сумматорное неравенство Йенсена было известно еще Гёльдеру.
Геометрическая интерпретация
Точка
(
∑ ∑ -->
i
=
1
n
q
i
x
i
;
∑ ∑ -->
i
=
1
n
q
i
f
(
x
i
)
)
{\displaystyle (\sum \limits _{i=1}^{n}{q_{i}x_{i}};\sum \limits _{i=1}^{n}{q_{i}f(x_{i})})}
является выпуклой комбинацией
n
{\displaystyle n}
точек
(
x
1
,
f
(
x
1
)
)
,
(
x
2
,
f
(
x
2
)
)
,
… … -->
,
(
x
n
,
f
(
x
n
)
)
{\displaystyle (x_{1},f(x_{1})),(x_{2},f(x_{2})),\dots ,(x_{n},f(x_{n}))}
плоскости, лежащих на графике функции
f
{\displaystyle f}
. Из определения выпуклой функции следует, что выпуклая оболочка этого множества точек лежит над графиком функции
f
{\displaystyle f}
, а это и означает, что
f
(
∑ ∑ -->
i
=
1
n
q
i
x
i
)
≤ ≤ -->
∑ ∑ -->
i
=
1
n
q
i
f
(
x
i
)
{\displaystyle f(\sum \limits _{i=1}^{n}{q_{i}x_{i}})\leq \sum \limits _{i=1}^{n}{q_{i}f(x_{i})}}
.
Интегральная формулировка
Пусть
φ φ -->
{\displaystyle \varphi }
— выпуклая функция,
μ μ -->
{\displaystyle \mu }
— вероятностная мера , а функции
f
{\displaystyle f}
и
φ φ -->
(
f
)
{\displaystyle \varphi (f)}
интегрируемы. Тогда[ 1]
φ φ -->
(
∫ ∫ -->
f
d
μ μ -->
)
⩽ ⩽ -->
∫ ∫ -->
φ φ -->
(
f
)
d
μ μ -->
.
{\displaystyle \varphi \left(\int f\,d\mu \right)\leqslant \int \varphi (f)\,d\mu .}
Для случая меры Лебега это неравенство имеет вид
φ φ -->
(
1
b
− − -->
a
∫ ∫ -->
a
b
f
(
x
)
d
x
)
≤ ≤ -->
1
b
− − -->
a
∫ ∫ -->
a
b
φ φ -->
(
f
(
x
)
)
d
x
.
{\displaystyle \varphi \left({\frac {1}{b-a}}\int _{a}^{b}f(x)\,dx\right)\leq {\frac {1}{b-a}}\int _{a}^{b}\varphi (f(x))\,dx.}
Вероятностная формулировка
Пусть
(
Ω Ω -->
,
F
,
P
)
{\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P} )}
— вероятностное пространство , и
X
: : -->
Ω Ω -->
→ → -->
R
{\displaystyle X\colon \Omega \to \mathbb {R} }
— определённая на нём случайная величина .
Пусть также
φ φ -->
: : -->
R
→ → -->
R
{\displaystyle \varphi \colon \mathbb {R} \to \mathbb {R} }
— выпуклая (вниз) борелевская функция .
Тогда если
X
,
φ φ -->
(
X
)
∈ ∈ -->
L
1
(
Ω Ω -->
,
F
,
P
)
{\displaystyle X,\varphi (X)\in L^{1}(\Omega ,{\mathcal {F}},\mathbb {P} )}
, то
φ φ -->
(
E
[
X
]
)
⩽ ⩽ -->
E
[
φ φ -->
(
X
)
]
{\displaystyle \varphi (\mathbb {E} [X])\leqslant \mathbb {E} [\varphi (X)]}
,
где
E
[
⋅ ⋅ -->
]
{\displaystyle \mathbb {E} [\cdot ]}
означает математическое ожидание .
Неравенство Йенсена для условного математического ожидания
Пусть в дополнение к предположениям, перечисленным выше,
G
⊂ ⊂ -->
F
{\displaystyle {\mathcal {G}}\subset {\mathcal {F}}}
— под-σ-алгебра событий . Тогда
φ φ -->
(
E
[
X
|
G
]
)
⩽ ⩽ -->
E
[
φ φ -->
(
X
)
|
G
]
{\displaystyle \varphi (\mathbb {E} [X|{\mathcal {G}}])\leqslant \mathbb {E} [\varphi (X)|{\mathcal {G}}]}
,
где
E
[
⋅ ⋅ -->
|
G
]
{\displaystyle \mathbb {E} [\cdot |{\mathcal {G}}]}
обозначает условное математическое ожидание относительно σ-алгебры
G
{\displaystyle {\mathcal {G}}}
.
Частные случаи
Пусть
a
1
,
… … -->
,
a
n
,
b
1
,
… … -->
,
b
n
{\displaystyle a_{1},\dots ,a_{n},b_{1},\dots ,b_{n}}
— положительные числа,
p
,
q
>
1
{\displaystyle p,q>1}
, причём
1
p
+
1
q
=
1
{\displaystyle {\frac {1}{p}}+{\frac {1}{q}}=1}
. Тогда
∑ ∑ -->
i
=
1
n
a
i
b
i
≤ ≤ -->
(
∑ ∑ -->
i
=
1
n
a
i
p
)
1
p
(
∑ ∑ -->
i
=
1
n
b
i
q
)
1
q
{\displaystyle \sum _{i=1}^{n}{a_{i}b_{i}}\leq \left(\sum _{i=1}^{n}{a_{i}}^{p}\right)^{\frac {1}{p}}\left(\sum _{i=1}^{n}{b_{i}}^{q}\right)^{\frac {1}{q}}}
.
Пусть
f
(
x
)
=
ln
-->
x
{\displaystyle \ f(x)=\ln x}
(вогнутая функция). Имеем:
∑ ∑ -->
i
=
1
n
q
i
ln
-->
x
i
≤ ≤ -->
ln
-->
(
∑ ∑ -->
i
=
1
n
q
i
x
i
)
{\displaystyle \sum _{i=1}^{n}{q_{i}\ln x_{i}}\leq \ln \left(\sum _{i=1}^{n}{q_{i}x_{i}}\right)}
, или
ln
-->
∏ ∏ -->
i
=
1
n
x
i
q
i
≤ ≤ -->
ln
-->
∑ ∑ -->
i
=
1
n
q
i
x
i
{\displaystyle \ln \prod _{i=1}^{n}{x_{i}^{q_{i}}}\leq \ln \sum _{i=1}^{n}{q_{i}x_{i}}}
. Потенцируя, получаем неравенство
∏ ∏ -->
i
=
1
n
x
i
q
i
≤ ≤ -->
∑ ∑ -->
i
=
1
n
q
i
x
i
{\displaystyle \prod _{i=1}^{n}{x_{i}^{q_{i}}}\leq \sum _{i=1}^{n}{q_{i}x_{i}}}
.
В частности, при
q
i
=
1
n
{\displaystyle q_{i}={\frac {1}{n}}}
получаем неравенство Коши (среднее геометрическое не превосходит среднего арифметического )
1
x
1
… … -->
x
n
n
≤ ≤ -->
x
1
+
… … -->
+
x
n
n
{\displaystyle {\sqrt[{n}]{{\phantom {1}}\!x_{1}\ldots x_{n}}}\leq {\frac {x_{1}+\ldots +x_{n}}{n}}}
.
Неравенство между средним гармоническим и средним геометрическим
Пусть
f
(
x
)
=
x
ln
-->
x
{\displaystyle \ f(x)=x\ln x}
(выпуклая функция). Имеем:
(
∑ ∑ -->
i
=
1
n
q
i
x
i
)
ln
-->
(
∑ ∑ -->
i
=
1
n
q
i
x
i
)
≤ ≤ -->
∑ ∑ -->
i
=
1
n
q
i
x
i
ln
-->
x
i
{\displaystyle \left(\sum _{i=1}^{n}{q_{i}x_{i}}\right)\ln \left(\sum _{i=1}^{n}{q_{i}x_{i}}\right)\leq \sum _{i=1}^{n}{q_{i}x_{i}\ln x_{i}}}
. Положив
q
i
=
1
x
i
∑ ∑ -->
i
=
1
n
1
x
i
{\displaystyle q_{i}={\frac {\frac {1}{x_{i}}}{\sum _{i=1}^{n}{\frac {1}{x_{i}}}}}}
и потенцируя, получаем:
n
1
x
1
+
… … -->
+
1
x
n
≤ ≤ -->
(
x
1
⋅ ⋅ -->
… … -->
⋅ ⋅ -->
x
n
)
1
/
n
{\displaystyle {\frac {n}{{\frac {1}{x_{1}}}+\ldots +{\frac {1}{x_{n}}}}}\leq \left(x_{1}\cdot \ldots \cdot x_{n}\right)^{1/n}}
(среднее гармоническое не превосходит среднего геометрического )
Неравенство между средним гармоническим и средним арифметическим
Пусть
f
(
x
)
=
1
x
{\displaystyle \ f(x)={\frac {1}{x}}}
(выпуклая функция). Имеем:
1
∑ ∑ -->
i
=
1
n
q
i
x
i
≤ ≤ -->
∑ ∑ -->
i
=
1
n
q
i
x
i
.
{\displaystyle {\frac {1}{\sum _{i=1}^{n}{q_{i}x_{i}}}}\leq \sum _{i=1}^{n}{\frac {q_{i}}{x_{i}}}.}
В частности при
q
i
=
1
n
{\displaystyle q_{i}={\frac {1}{n}}}
получаем, что среднее гармоническое не превосходит среднего арифметического :
n
1
x
1
+
… … -->
+
1
x
n
≤ ≤ -->
x
1
+
… … -->
+
x
n
n
.
{\displaystyle {\frac {n}{{\frac {1}{x_{1}}}+\ldots +{\frac {1}{x_{n}}}}}\leq {\frac {x_{1}+\ldots +x_{n}}{n}}.}
См. также
Примечания
Литература
Зорич В. А. Гл. V. Дифференциальное исчисление // Математический анализ. Часть I. — 6-е изд. — М. : МЦНМО , 2012. — С. 289—290. — 2000 экз. — ISBN 978-5-94057-892-5 .
Фихтенгольц Г. М. Гл. IV. Исследование функций с помощью производных // Курс дифференциального и интегрального исчисления. — 8-е изд. — М. : ФИЗМАТЛИТ, 2001. — Т. 1. — С. 336—337. — 5000 экз. — ISBN 5-9221-0156-0 .