Авторские права на сайт принадлежат Данилу и Евгению Гилядовым
Нейронная сеть Элмана – это разновидность рекуррентной нейронной сети, предложенная Джеффри Элманом в 1990 году. Её отличительная особенность – наличие обратных связей от скрытого слоя на его же вход.
Принцип работы:
- Сеть Элмана имеет слой скрытых рекуррентных нейронов.
- Состояние скрытого слоя на предыдущем шаге подаётся на вход скрытого слоя вместе с входными данными.
- Это позволяет учитывать предысторию и моделировать контекст.
Обучение сети Элмана осуществляется методом обратного распространения ошибки во времени, аналогично сети Джордана.
Особенности сети Элмана:
- Более простая структура по сравнению с сетью Джордана.
- Хорошо масштабируется для больших задач.
- Устойчива к проблеме «исчезающего градиента».
Сеть Элмана широко использовалась в задачах обработки естественного языка. Она послужила основой для разработки LSTM и других современных рекуррентных архитектур.