Я знаю, что это может быть основной вопрос, но я хочу знать, использую ли я поезд, правильно ли тестирую разделение.
Скажем, у меня есть данные, которые заканчиваются в 2019 году, и я хочу предсказать значения на следующие 5 лет.
График, который я создал, представлен ниже:
Мои тренировочные данные начинаются с 1996-2014 годов, а мои тестовые данные начинаются с 2014-2019 годов. Тестовые данные идеально соответствуют тренировочным данным. Затем я использовал эти тестовые данные, чтобы сделать прогнозы на 2019–2024 годы.
Это правильный способ сделать это, или мои прогнозы также должны быть с 2014 по 2019 год, как и тестовые данные?