Управляемый рекуррентный блок: различия между версиями
Перейти к навигации
Перейти к поиску
imported>Alex NB OT м Форматирование дат согласно Википедия:Техническое соглашение о датах и времени и Википедия:Обсуждение правил/Википедия:Техническое соглашение о датах и времени |
(нет различий)
|
Текущая версия от 12:41, 16 сентября 2023
Управляемые рекуррентные блоки (Шаблон:Lang-en, GRU) — механизм вентилей для рекуррентных нейронных сетей, представленный в 2014 году. Было установлено, что его эффективность при решении задач моделирования музыкальных и речевых сигналов сопоставима с использованием долгой краткосрочной памяти (LSTM).[1] По сравнению с LSTM у данного механизма меньше параметров, т.к. отсутствует выходной вентиль.[2]
Архитектура
обозначает произведение Адамара. .
Переменные
- : входной вектор
- : выходной вектор
- : вектор вентиля обновления
- : вектор вентиля сброса
- , и : матрицы параметров и вектор
- : на основе сигмоиды.
- : на основе гиперболического тангенса.
См. также
Примечания
Шаблон:Типы искусственных нейронных сетей Шаблон:Машинное обучение