Радиально-базисная функция

Материал из testwiki
Версия от 21:46, 16 декабря 2023; imported>Alex NB OT (Чистка шаблонов Cite после обновления модуля: 1 проход)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Радиальная базисная функция (РБФ) — функция из набора однотипных радиальных функций, используемых как функция активации в одном слое искусственной нейронной сети или как-либо ещё, в зависимости от контекста. Шаблон:Iw — это любая вещественная функция, значение которой зависит только от расстояния до начала координат ϕ(𝐱)=ϕ(𝐱) или от расстояния между некоторой другой точкой 𝐜, называемой центром: ϕ(𝐱,𝐜)=ϕ(𝐱𝐜). В качестве нормы обычно выступает евклидово расстояние, хотя можно использовать и другие метрики.

Линейные комбинации радиальных базисных функций также можно использовать для аппроксимации заданной функции. Аппроксимация может быть интерпретирована как простейшая разновидность нейронной сети; именно в этом контексте радиальные базисные функции были впервые определены в работе Дэвида Брумхэда и Дэвид Лоу в 1988 году[1][2], основанной на фундаментальной работе Майкла Пауэлла 1977 года[3][4][5].

Радиальные базисные функции также используются в качестве ядра в методе опорных векторов.[6]

Виды

Часто используемые радиально-базисные функций включают в себя (r=𝐱𝐱i):

Приближение

Две ненормализованных гауссовых радиальных базисных функций одной переменной, c центрами в точках x1=0,75 и x2=3,25 соответственно.

Для аппроксимации функций с помощью радиальных базисных функций обычно берётся их линейная комбинация вида:

y(𝐱)=i=1Nwiϕ(𝐱𝐱i),

где в качестве аппроксимирующей функции y(𝐱) берётся сумма N радиальных базисных функций с центрами в точках 𝐱i и коэффициентами wi. Коэффициенты можно вычислить с помощью метода наименьших квадратов, поскольку аппроксимирующая функция является линейной по отношению к коэффициентам wi.

Аппроксимационные схемы такого рода особенно полезныШаблон:Нет АИ в прогнозировании временных рядов, управлении нелинейных систем, демонстрирующих достаточно простое хаотическое поведение, и 3D-моделировании в компьютерной графике.

Нейронные сети на основе РБФ

Шаблон:Основная статья Линейная комбинация:

y(𝐱)=i=1Nwiϕ(𝐱𝐱i)

также может быть интерпретирована как простейшая искусственная нейронная сеть с одним слоем, называемая сетью радиально-базисных функций, в которой радиальная базисная функция исполняет роль функции активации. Можно показать, что любая непрерывная функция на компактном интервале в принципе может быть интерполирована с произвольной точностью при достаточно большом N.

Аппроксимации y(𝐱) является дифференцируемой по wi. Коэффициенты можно вычислить при помощи любого стандартного итерационного метода для нейронных сетей.

Таким образом, радиальные базисные функции предоставляют собой гибкий инструмент интерполирования при условии, что множество центров более-менее равномерно покрывает область определения искомой функции (в идеале центры должны быть равноудалены от ближайших соседей). Тем не менее, как правило в промежуточных точках аппроксимация достигает высокой точности только если множество радиальных базисных функций дополнено полиномом, ортогональным к каждой из РБФ.

Примечания

Шаблон:Примечания

Литература

Шаблон:Машинное обучение

  1. Radial Basis Function networks Шаблон:Webarchive
  2. Шаблон:Harvard citation no brackets
  3. Шаблон:Статья
  4. Шаблон:Cite thesis
  5. Шаблон:Harvard citation no brackets: «We would like to thank Professor M.J.D. Powell at the Department of Applied Mathematics and Theoretical Physics at Cambridge University for providing the initial stimulus for this work.»
  6. Шаблон:Cite web