Гессиан функции

Материал из testwiki
Перейти к навигации Перейти к поиску

Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции f, дважды дифференцируемой в точке xn

H(x)=i=1nj=1naijxixj

или

H(z)=i=1nj=1naijzizj

где aij=2f/xixj (или aij=2f/zizj) и функция f задана на n-мерном вещественном пространстве n (или комплексном пространстве n) с координатами x1,,xn (или z1,,zn). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы (aij), см. ниже.

Матрица Гессе

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

H(f)=[2fx122fx1x22fx1xn2fx2x12fx222fx2xn2fxnx12fxnx22fxn2]

Определитель этой матрицы называется определителем Гессе, или просто гессианомШаблон:Нет АИ.

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы Гессе

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

xi(fxj)=xj(fxi)

Это можно также записать как

fxixj=fxjxi,i,j{1,,n}.

В этом случае матрица Гессе симметрична.

Критические точки функции

Если градиент f (её векторная производная) равен нулю в некоторой точке x0, то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то x0 — точка локального минимума функции f(x),
  • если гессиан отрицательно определён, то x0 — точка локального максимума функции f(x),
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (detH(f)0), то x0 — седловая точка функции f(x).

Вариации и обобщения

Вектор-функции

Если f — вектор-функция, то есть

f=(f1,f2,,fn),

то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из n матриц Гессе:

H(f)=(H(f1),,H(fn)).

При n=1 данный тензор вырождается в обычную матрицу Гессе.

Окаймлённый гессиан

При решении задачи нахождения условного экстремума функции f:n с ограничениями

{g1(x)=0,gm(x)=0,

где xn, m<n, для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа L(x,λ), который будет иметь вид[2]

(2Lx22Lxλ(2Lxλ)T2Lλ2)=(2Lx122Lx1xng1x1gmx12Lxnx12Lxn2g1xngmxng1x1g1xn00gmx1gmxn00).

Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют x*n и λ*m такие, что L(x*,λ*)=0 и

(1)mdet(2Lx122Lx1xpg1x1gmx12Lxpx12Lxp2g1xpgmxpg1x1g1xp00gmx1gmxp00)>0

для p=m+1,,n, то в точке x* функция f имеет строгий условный минимум. Если же

(1)pdet(2Lx122Lx1xpg1x1gmx12Lxpx12Lxp2g1xpgmxpg1x1g1xp00gmx1gmxp00)>0

для p=m+1,,n, то в точке x* функция f имеет строгий условный максимум[3].

История

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. также

Примечания

Шаблон:Примечания

Ссылки

  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.

Шаблон:Дифференциальное исчисление