Метод Гамильтона — Якоби решения вариационных задач

Материал из testwiki
Перейти к навигации Перейти к поиску

Метод Гамильтона — Якоби сводит задачу нахождения экстремалей (или задачу интегрирования гамильтоновой системы уравнений) к интегрированию уравнения в частных производных первого порядка — так называемого уравнения Гамильтона — Якоби. Основы теории Гамильтона-Якоби были разработаны Гамильтоном в 1820-х годах для задач волновой оптики и геометрической оптики. В 1834 году Гамильтон распространил свои идеи на проблемы динамики, и Якоби (1837) применил метод к общим задачам классического вариационного исчисления[1].

Начальные точки теории Гамильтона-Якоби были установлены в 17 веке Ферма и Гюйгенсом, которые использовали для этой цели предмет геометрической оптики (см. Принцип Ферма; принцип Гюйгенса).

Алгоритм

Рассмотрим шаги Гамильтона и проблему распространения света в неоднородной (но для простоты, изотропной) среде, где v(x) — локальная скорость света в точке x.

Согласно принципу Ферма, свет распространяется от точки к точке в неоднородной среде в кратчайшие сроки. Пусть x0Eбудет начальной точкой, и пусть W(x) будет кратчайшим возможным временем, когда свет пройдет расстояние от x0> до x Функция W(x) известна как эйконал или оптическая длина пути. Предполагается, что за короткое время dt свет проходит от точки x до точки x+dx. Согласно принципу Гюйгенса, свет будет распространяться, кроме малых величин более высокого порядка, по нормали к поверхности уровня функции W(x). Таким образом, выполняется уравнение[2]:

W(x+W(x)|W(x)|v(x)dt)=W(x)+dt+o(dt).

И уравнение Гамильтона-Якоби для задач геометрической оптики имеет вид:

|W(x)|2=1v2(x)i=13(W(x)xi))2=1v2(x).

В аналитической механике роль принципа Ферма играет вариационный принцип Гамильтона-Остроградского, а роль эйконала играет функционал действия, то есть интеграл:

S(t,x)=γLdt, (1)

вдоль траектории γ, соединяющей данную точку (t0,x0) с точкой (t,x), где находится функция Лагранжа механической системы, x=(x1,...,xn).

Якоби предложил использовать функцию, напоминающую функционал действия (1), при решении всех задач классического вариационного исчисления. Экстремалы задачи Ldtinf, выходящей из точки (t0,x0), пересекают поверхность уровня основной функции трансверсально (см. условие трансверсальности). Форма дифференциала функционала действия:

dS=(p|dx)Hdt

выводится из этого условия. Здесь p=Lx и H=pxL — функции Гамильтона (см. также преобразование Лежандра).

Последнее упомянутое соотношение дает следующее уравнение для функции S:

St+H(t,x,Sx)=0. (2)

Это уравнение Гамильтона — Якоби[3].

Наиболее важным результатом теории Гамильтона — Якоби является теорема Якоби, которая утверждает, что полный интеграл уравнения (2), то есть решение S(t,x,α) этого уравнения, которое будет зависеть от параметров α=(α,...,α) (при условии, что det|2Sxα|0), позволяет получить полный интеграл уравнения для функционала Эйлера (1) или, что то же самое, гамильтоновой системы, связанной с этим функционалом формулами Sx=p, Sα=β. Применение теоремы Якоби к интегрированию гамильтоновых систем обычно основано на методе разделения переменных в специальных координатах.

Применение

Несмотря на то, что интегрирование уравнений в частных производных обычно сложнее, чем решение обыкновенных уравнений, теория Гамильтона-Якоби оказалась мощным инструментом в изучении проблем оптики, механики и геометрии. Суть принципа Гюйгенса была использована Беллманом при решении задач оптимального управления. См. также инвариантный интеграл Гильберта.

Комментарии

В оптимальном управлении уравнение Гамильтона-Якоби имеет, например, форму:

Vt+H(t,x,Vx)=0,V(t,x)=ϕ(t1,x),t0tt1,

где

H(t,x,Vx)=min{(Vx,f(t,x,u))+f0(t,x,u):uU}.

См., например, оптимальное управление синтезом. В этом случае его часто называют уравнением Беллмана (особенно в технической литературе) или уравнением Гамильтона-Якоби-Беллмана[4]. Существует также версия для оптимального стохастического управления, см. [slovar.wikireading.ru/2700830 управляемый случайный процесс][5]. Поскольку классические решения уравнения Гамильтона-Якоби часто не существуют, возникает необходимость рассмотреть различные виды обобщённых решений, таких как решения с вязкостью.

Примечания

Шаблон:Примечания


Шаблон:Изолированная статья

Шаблон:Спам-ссылки