Отсев - это метод регуляризации. Вы должны использовать его только для уменьшения дисперсии (эффективность проверки по сравнению с производительностью обучения). Он не предназначен для уменьшения систематической ошибки, и вы не должны использовать его таким образом. это вводит в заблуждение.
Вероятно, причина такого поведения в том, что вы используете очень высокое значение для отсева. 0,9 означает, что вы нейтрализуете слишком много нейронов. Имеет смысл, что если вместо этого вы поставите 0,7, у сети появятся нейроны более высокого уровня, которые можно использовать при обучении на обучающей выборке. Таким образом, производительность будет увеличиваться при более низких значениях.
Обычно вы должны видеть, что производительность обучения немного снижается при увеличении производительности на проверочном наборе (если у вас его нет, по крайней мере, на тестовом наборе). Это желаемое поведение, которое вы ищете при использовании исключения. Текущее поведение, которое вы получаете, связано с очень высокими значениями для исключения.
Начните с 0,2 или 0,3 и сравните смещение и дисперсию, чтобы получить хорошее значение для отсева.
Моя четкая рекомендация: используйте его не для улучшения смещения, а для уменьшения дисперсии (ошибка при проверке).
Для того, чтобы лучше подходить к тренировочному набору, я рекомендую:
- найти лучшую архитектуру (или изменить количество нейронов на слой)
- попробуйте разные оптимизаторы
- настройка гиперпараметров
- возможно, обучить сеть немного дольше
Надеюсь, это поможет!
26.11.2019