Управляемый рекуррентный блок

Материал из testwiki
Перейти к навигации Перейти к поиску

Управляемые рекуррентные блоки (Шаблон:Lang-en, GRU) — механизм вентилей для рекуррентных нейронных сетей, представленный в 2014 году. Было установлено, что его эффективность при решении задач моделирования музыкальных и речевых сигналов сопоставима с использованием долгой краткосрочной памяти (LSTM).[1] По сравнению с LSTM у данного механизма меньше параметров, т.к. отсутствует выходной вентиль.[2]

Архитектура

обозначает произведение Адамара. h0=0.

zt=σg(Wzxt+Uzht1+bz)rt=σg(Wrxt+Urht1+br)ht=ztht1+(1zt)σh(Whxt+Uh(rtht1)+bh)

Переменные

  • xt: входной вектор
  • ht: выходной вектор
  • zt: вектор вентиля обновления
  • rt: вектор вентиля сброса
  • W, U и b: матрицы параметров и вектор

Функции активации

См. также

Примечания

Шаблон:Примечания

Шаблон:Типы искусственных нейронных сетей Шаблон:Машинное обучение