Неравенство Гаусса

Материал из testwiki
Перейти к навигации Перейти к поиску

В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.

Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (Xm)2. (τ2 может также быть выражено как (μm)2 + σ2, где μ и σ являются средним значением и стандартным отклонением X.)

Pr(|Xm|>k){(2τ3k)2,if k2τ3;1kτ3,if 0k2τ3.

Эта теорема была впервые доказана Гауссом в 1823 году.

Доказательство

Без ограничения общности можно считать, что мода находится в нуле, то есть m=0.

Переход к квантилям

Рассмотрим вероятность того, что выполняется неравенство |X|x, как функцию от x:

p(x)=xxf(z)dz.

Так как f(x) является неотрицательной функцией, то p(x) растёт с ростом x.

Кроме того, по определению определённого интеграла:

p(0)=0.

В силу формулы Лейбница:

dpdx=f(x)+f(x).

Рассмотрим обратную функцию (квантиль) распределения случайной величины |X|:

x=q(p).

В силу теоремы о производной обратной функции:

q(p)=dxdp=[dpdx]1=1f(x)+f(x).

Заметим, что с ростом p возрастает и x, в силу унимодальности с ростом по модулю x функция f(x) не возрастает, значит с ростом x функция q(p) не убывает.

Линеаризация функции q(p)

Выберем произвольную точку q0=q(p0) и линеаризуем q(p) точке p0, то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:

L(p)=q(p0)+q(p0)(pp0)=q0+q(p0)(pp0).

Данное уравнение можно переписать следующим образом:

L(p)=q(p0)(pp1),

где

p1=p0q0q(p0)=p0(1q0p0q(p0))=gp0.

Поскольку величины p0, q0и q(p0) являются неотрицательными, то

0p1p0,

а значит

0g1.

Так как q(p) не убывает с ростом p, а L(p)=q(p0)=const,то разность q(p)L(p) имеет тот же знак, что pp0. Из этого следует, что величина q(p)L(p) всегда является неотрицательной, а следовательно:

q(p)L(p).

Поскольку q(p)0 то из L(p)0 (то есть из pp1) следует

L2(p)q2(p).

Получение оценки

Проинтегрируем последнее неравенство в пределах от p1до 1:

p11L2(p)dpp11q2(p)dp01q2(p)dp=+x2f(x)dx.

Последнее выражение обозначим как τ2:

τ2=+x2f(x)dx.

Данная величина есть математическое ожидание квадрата случайной величины X. По свойствам дисперсии:

τ2=μ2+σ2,

где σ2— дисперсия случайной величины X, μ — её математическое ожидание.

Вычислим теперь интеграл в левой части последнего неравенства:

p11L2(p)dp=p11[q(p0)]2(pp1)2dp=[q(p0)]2(pp1)33|p11=[q(p0)]2(1p1)33τ2
p1=p0q0q(p0).
p0p1=q0q(p0)
q(p0)=q0p0p1
[q0p0p1]2(1p1)33τ2

Преобразуем это неравенство к виду

q02τ23(p0p1)2(1p1)3=3(p0gp0)2(1gp0)3=3p02(1g)2(1gp0)3.

Исследование верхней границы

Исследуем верхнюю границу на экстремальные значения (в зависимости от значения g). Начнём с нахождения корней производной:

g[3p02(1g)2(1gp0)3]==3p022(1g)(1)(1gp0)3(1g)23(1gp0)2(p0)(1gp0)6==3p02(1g)(1gp0)2[2(1gp0)+3(1g)p0](1gp0)6==3p02(1g)(1gp0)4[2+2gp0+3p03gp0]==3p02(1g)(1gp0)4[23p0+gp0]

Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:

23p0+g0p0=0.

Решая данное уравнение, получим:

g0p0=3p02.
g0=32p0.

Величина g также должно удовлетворять условию 0g1 :

032p01

Решая данное неравенство, получим:

32p02
22p03
13p0212
23p01.

Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать [0;1] только при p023.

Рассмотрим сначала случай p023.

В этом случае всегда

g[3p02(1g)2(1gp0)3]0,

а следовательно максимум выражения в квадратных скобках достигается при g=0:

q02τ23p02

или

p0q0τ3.

Если же p0>23, то максимум будет в точке g0=32p0=3p02p0. Вычислим необходимые нам величины:

1g0=13+2p0=2p02=2(1p0)p0

и

1g0p0=1(3p02)=3(1p0).

Подставляя эти выражения в исследуемое неравенство, получим:

q02τ23p02(1g)2(1gp0)3=3p0233(1p0)322(1p0)2p02=(23)211p0

или

1p0(23)2τ2q02.

Объединим полученные неравенства:

q02τ2{3p02,p023491(1p0),p0>23

Извлекая квадратный корень, окончательно получим:

q0τ{3p0,p0232311p0,p0>23

Обращение неравенств

Если p023, то

q02τ23p023(23)2=43.

Откуда получаем

q02τ3.

Это позволяет получить следующее неравенство:

1p0={1q03τ,q02τ349τ2q02,q02τ3

Обозначая p0=p и q0=x, получим:

Pr{|X|>x}={1x3τ,x2τ349τ2x2,x2τ3.

Завершение доказательства

Выше мы предполагали, что мода случайной величины X равна нулю. В случае произвольной моды m, нужно приведённые выше рассуждения применить к случайной величине Xm, мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:

Pr{|Xm|>x}={1x3τ,x2τ349τ2x2,x2τ3.

Величина τ2перейдём, по свойствам математического ожидания и дисперсии, в

τ2=(μm)2+σ2.

Таким образом, теорема полностью доказана.

См. также

Ссылки