Глубокая сеть доверия

Материал из testwiki
Версия от 00:57, 24 февраля 2025; imported>Sldst-bot (Замена редиректа ш:Стиль на актуальный ш:Стиль статьи с добавлением даты установки: 2017-01-04)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Шаблон:Стиль статьи

Схематическое представление глубокой сети доверия. Стрелки представляют направленные соединения в графовой вероятностной модели, представляемую сетью.

Глубокая сеть доверия (ГСД, Шаблон:Lang-en) — это порождающая графическая модель, или один из типов глубинных нейронных сетей, состоящая из нескольких скрытых слоёв, в которых нейроны внутри одного слоя не связаны друг с другом, но связаны с нейронами соседнего слоя[1].

При обучении на наборе примеров[en] спонтанным образом ГСД может обучаться как вероятностно отстраивать свои входы. Слои в этом случае выступают в роли детекторов признаков входов[1]. По окончании обучения ГСД может быть обучена с учителем для осуществления классификации[2].

ГСД можно рассматривать как композицию простых, спонтанных сетей, таких как ограниченные машины Больцмана (ОМБ)[1] или автокодировщики[3], в которых скрытый слой каждой подсети служит видимым слоем для следующей. Это позволяет осуществить быструю послойную процедуру обучения без учителя, в которой относительное расхождение применяется к каждой подсети по очереди, начиная с первой пары слоёв (на видимый слой которой подается тренировочный набор примеров[en]).

Наблюдение, сделанное Шаблон:Lang-en, учеником Джеффри Хинтона[2], говорит о том, что ГСД может быть обучена способом жадного послойного обучения, что стало одним из первых действенных алгоритмов глубинного обучения[4]:6Шаблон:Rp.

Алгоритм обучения

Алгоритм тренировки ГСД работает следующим образом[2]. Пусть X будет матрицей входов, что рассматривается как набор признаков.

  1. Представить два нижних слоя (входной и первый скрытый) как ограниченную машину Больцмана (ОМБ). Обучить её на входных данных X и получить матрицу её весовых коэффициентов W, которая будет описывать связи между двумя нижними слоями сети.
  2. Пропустить через обученную машину Больцмана входные данные X и получить данные скрытого слоя X на выходе после активации узлов первого скрытого слоя.
  3. Повторять эту процедуру с XX для каждой следующей пары слоёв, пока не будут обучены два самых верхних слоя сети.
  4. Осуществить тонкую настройку всех параметров этой глубокой сети с сохранением логарифмического правдоподобия ГСД или с использованием обучения с учителем (после добавления дополнительных механизмов обучения для выполнения обученной сетью работы, например, линейно-сепарабельного классификатора).

См. также

Примечания

Шаблон:Примечания

Ссылка

Шаблон:Типы искусственных нейронных сетей Шаблон:Машинное обучение

  1. 1,0 1,1 1,2 Шаблон:Статья
  2. 2,0 2,1 2,2 Hinton, G. E.; Osindero, S.; Teh, Y. W. (2006).
  3. Шаблон:Cite conference
  4. Шаблон:Статья