Стохастическая аппроксимация

Материал из testwiki
Перейти к навигации Перейти к поиску

Стохастическая аппроксимациярекуррентный метод построения состоятельной последовательности оценок решений уравнений регрессии и экстремумов функций регрессии в задачах непараметрического оценивания. В биологии, химии, медицине используется для анализа результатов опытов. В теории автоматического управления применяется как средство решения задач распознавания, идентификации, обучения и адаптации[1]. Основоположниками метода стохастической аппроксимации являются Кифер, Вольфовиц[2], Робинс, Монро [3].

Поиск решения уравнения регрессии

Пусть каждому значению параметра x соответствует измеряемая опытным путём случайная величина y с функцией распределения F(y|x), причем математическое ожидание величины y при фиксированном параметре x m(y|x)=m(x). Требуется найти решение уравнения регрессии m(x)=α. Предполагается, что решение уравнения регрессии единственно, а функции F(y|x) и m(x) неизвестны.

Процедура стохастической аппроксимации для получения оценок корня x^ уравнения регрессии m(x^)=α заключается в использовании полученной на основании опыта обучающей выборки измеряемых случайных величин y1,...,yn.

Оценка xn+1^ искомого корня находится на основе предыдущей оценки xn^ с помощью обучающего значения измеренной случайной величины yn с помощью соотношения xn+1^=xn^+an(αyn), где n1, x1^ - произвольное число[3].

Если последовательность коэффициентов an удовлетворяет условиям an>0, n=1an=, n=1an2<, то при n оценка xn+1^ стремится по вероятности к корню уравнения m(x^)=α.

При некоторых дополнительных требованиях к функции регрессии m(x) оценки xn+1^ могут сходится в среднеквадратическом к решению уравнения регрессии Шаблон:Sfn[4].

Примеры

  • Твёрдость сплава меди с железом y зависит от времени x, в течение которого сплав подвергается воздействию высокой температуры. В этом случае измеряемой случайной величиной является твёрдость сплава y, а задача состоит в определении времени x^, при котором сплав имеет заданную твёрдость y=αШаблон:Sfn.

Поиск экстремума функции регрессии

Оценка xn+1^ экстремального значения функции регрессии находится на основе предыдущей оценки xn^ и обучающих значений измеренной случайной величины y2n и y2n1 с помощью соотношения xn+1^=xn^+ancn(y2ny2n1), где n1, x1^ - произвольное число, an - последовательность положительных чисел, а последовательности y2n и y2n1 независимы и соответствуют значениям параметра xn^+cn и xn^cn[2].

Если последовательности коэффициентов an и cn удовлетворяют условиям an>0, cn>0, cn0 при n, n=1an=, n=1ancn<, n=1(ancn)2<, то при n оценка xn+1^ стремится по вероятности к экстремальному значению функции регрессии.

При некоторых дополнительных требованиях к функции регрессии m(x) оценки xn+1^ могут сходится в среднеквадратическом к экстремуму функции регрессии[4].

Примеры

  • Урожайность участка земли y зависит от количества удобрений x. В этом случае измеряемой случайной величиной является урожайность y, а задача состоит в определении количества удобрений x^, при котором участок земли имеет макcимальную урожайностьШаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

  1. Цыпкин Я.З. “Адаптация, обучение и самообучение в автоматических системах”, // Автоматика и телемеханика. — 1966. — № 1. — С. 23–61. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at10991
  2. 2,0 2,1 Кiefer J., Wolfowitz J. Stochastic Estimation of the Maximum of a Regression Function // Ann. Math. Statistics. — 1952. — v. 23. — № 3.
  3. 3,0 3,1 Robbins Н., Monro S. A stochastic approximation method // Annals of Math. Stat. — 1951. — v. 22. — № 1. — С. 400—407.
  4. 4,0 4,1 Логинов Н. В. “Методы стохастической аппроксимации” // Автоматика и телемеханика. — 1966. — № 4. — С. 185–204. — ISSN 0005-2310. — URL: http://mi.mathnet.ru/at11080