Условия Вольфе

Материал из testwiki
Перейти к навигации Перейти к поиску

Условия Вольфе — в теории оптимизации набор условий, которые используются в алгоритме приближенного поиска вдоль направления, в алгоритме Бройдена — Флетчера — Гольдфарба — Шанно (BFGS). Впервые опубликованы Филипом Вольфе в 1969 году.

Описание

Пусть решается задача минимизации

minxf(x),

уже имеется приближение решения задачи xk и пусть каким-либо методом мы нашли направление pk, в котором будем искать новое приближение решения xk+1. Тогда xk+1=xk+αkpk, где αk удовлетворяет условиям Вольфе:

f(xk+αkpk)f(xk)+c1αkfkTpk,
f(xk+αkpk)Tpkc2fkTpk

Константы выбираются следующим образом: 0<c1<c2<1. Обычно константа c1 выбирается достаточно маленькой (в окрестности 0), что означает, что функция после совершения шага должна уменьшиться, в то время как c2 выбирается значительно большей (в окрестности 1), что, в свою очередь, означает, что проекция градиента в новом приближении должна либо изменить направление, либо уменьшиться.

Усиленные условия Вольфе

Другой вариант условий Вольфе, который предполагает, что новое приближение лежит в окрестности локального минимума функции ϕ(α)=f(xk+αpk):

f(xk+αkpk)f(xk)+c1αkfkTpk,
|f(xk+αkpk)Tpk|c2|fkTpk|

Первое неравенство оставлено таким же, как и в условиях Вольфе, а второе изменено таким образом, чтобы проекция градиента должна уменьшиться по модулю. Таким образом исключаются точки, которые находятся далеко от стационарных точек функции ϕ. Константы подбираются так же, как и в условиях Вольфе.

Свойства

Можно показать, что если pk — направление убывания ограниченной снизу и непрерывно дифференциируемой функции f, каждый шаг αk удовлетворяет условиям Вольфе, а градиент функции f непрерывен по Липшицу:

x,x~N||f(x)f(x~)||L||xx~||,

то

k0cos2θk||fk||2<,

где

cosθk=fkTpk||fk||||pk||.

Отсюда следует, что

cos2θk||fk||20 при k, что означает, что алгоритм сходится.

Литература

  1. Nocedal J., Wright S. Numerical optimization, series in operations research and financial engineering //Springer, New York. – 2006.
  2. Wolfe P. Convergence conditions for ascent methods //Siam Review. – 1969. – Т. 11. – №. 2. – С. 226-235.
  3. Wolfe P. Convergence conditions for ascent methods. II: Some corrections //SIAM review. – 1971. – Т. 13. – №. 2. – С. 185-188.