AdaBoost

AdaBoost (сокращение от Шаблон:Lang-en) — алгоритм машинного обучения, предложенный Шаблон:Не переведено 5 и Шаблон:Не переведено 5. Может использоваться в сочетании с несколькими алгоритмами классификации для улучшения их эффективности. Алгоритм усиливает классификаторы, объединяя их в ансамбль. Является адаптивным в том смысле, что каждый следующий ансамбль классификаторов строится по объектам, неверно классифицированным предыдущими комитетами. AdaBoost чувствителен к шуму в данных и выбросам. Однако он менее подвержен переобучению по сравнению с другими алгоритмами машинного обучения.

AdaBoost вызывает слабые классификаторы в цикле $t = 1, \dots, T$ . После каждого вызова обновляется распределение весов $D_{t}$ , которые отвечают важности каждого из объектов обучающего множества для классификации. На каждой итерации веса каждого неверно классифицированного объекта возрастают, таким образом новый комитет классификаторов «фокусирует своё внимание» на этих объектах.

Алгоритм для задачи построения бинарного классификатора

Шаблон:См. также Дано: $(x_{1}, y_{1}), \dots, (x_{m}, y_{m})$ где $x_{i} \in X, y_{i} \in Y = {- 1, + 1}$

Инициализируем $D_{1} (i) = \frac{1}{m}, i = 1, \dots, m .$

Для каждого $t = 1, \dots, T$ :

Находим классификатор $h_{t} : X \to {- 1, + 1}$ который минимизирует взвешенную ошибку классификации: $h_{t} = \arg \min_{h_{j} \in ℋ} ϵ_{j}$ , где $ϵ_{j} = \sum_{i = 1}^{m} D_{t} (i) [y_{i} \neq h_{j} (x_{i})]$
Если величина $ϵ_{t} ⩾ 0.5$ , то останавливаемся.
Выбираем $α_{t} \in 𝐑$ , обычно $α_{t} = \frac{1}{2} ln \frac{1 - ϵ_{t}}{ϵ_{t}}$ где $ϵ_{t}$ взвешенная ошибка классификатора $h_{t}$ .
Обновляем:

D_{t + 1} (i) = \frac{D_{t} (i) e^{- α_{t} y_{i} h_{t} (x_{i})}}{Z_{t}}

где

Z_{t}

является нормализующим параметром (выбранным так, чтобы

D_{t + 1}

являлось распределением вероятностей, то есть

\sum_{i = 1}^{m} D_{t + 1} (i) = 1

).

Строим результирующий классификатор:

H (x) = sign (\sum_{t = 1}^{T} α_{t} h_{t} (x))

Выражение для обновления распределения $D_{t}$ должно быть сконструировано таким образом, чтобы выполнялось условие:

e^{- α_{t} y_{i} h_{t} (x_{i})} {\begin{matrix} < 1, & y (i) = h_{t} (x_{i}) \\ > 1, & y (i) \neq h_{t} (x_{i}) \end{matrix}

Таким образом, после выбора оптимального классификатора $h_{t}$ для распределения $D_{t}$ , объекты $x_{i}$ , которые классификатор $h_{t}$ идентифицирует корректно, имеют веса меньшие, чем те, которые идентифицируются некорректно. Следовательно, когда алгоритм тестирует классификаторы на распределении $D_{t + 1}$ , он будет выбирать классификатор, который лучше идентифицирует объекты неверно распознаваемые предыдущим классификатором.

Ссылки

AdaBoost Шаблон:Ref-en Презентация, посвящённая Adaboost.
A Short Introduction to Boosting Шаблон:Ref-en Введение в Adaboost, Freund и Schapire, 1999
A decision-theoretic generalization of on-line learning and an application to boosting Journal of Computer and System Sciences, no. 55. 1997 Шаблон:Ref-en (Оригинальная работа Yoav Freund и Robert E.Schapire, где впервые был предложен Adaboost.)
An applet demonstrating AdaBoost Шаблон:Ref-en
Ensemble Based Systems in Decision Making, R. Polikar, IEEE Circuits and Systems Magazine, vol.6, no.3, pp. 21-45, 2006 Шаблон:Недоступная ссылка Шаблон:Ref-en Учебник, дающий общее представление об AdaBoost, включая псевдокод, схемы алгоритмов, вопросы реализации и других алгоритмах распознавания образов.
A Matlab Implementation of AdaBoost Шаблон:Ref-en
Additive logistic regression: a statistical view of boosting. Jerome Friedman, Trevor Hastie, Robert Tibshirani Шаблон:Ref-en Обсуждаются вероятностные аспекты AdaBoost, описывается GentleBoost.
Boosting — Усиление простых классификаторов. Александр Вежневец, Владимир Вежневец. Компьютерная графика и мультимедиа. Выпуск № 2(12)/2006.

Шаблон:Rq Шаблон:Машинное обучение

AdaBoost

Алгоритм для задачи построения бинарного классификатора

Ссылки

Навигация

Поиск