Каждый день мы открываем погодное приложение на мобильном устройстве и смотрим прогноз погоды или, просматривая новости фондового рынка, просматриваем такие термины, как прогноз для день. Итак, как они предсказывают дневной бум/спад фондового рынка или как они предсказывают погоду на неделю вперед? Анализ временных рядов — один из наиболее распространенных методов, помогающих прогнозировать тенденции в конкретной области или варианте использования. Итак, что такое Анализ временных рядов?

Анализ временных рядов — это анализ данных об одних и тех же явлениях, которые собираются через равные промежутки времени в заданном временном диапазоне. Например, предприятие по производству одежды анализирует продажи шерстяной одежды с течением времени. Анализируя ежемесячные данные за 4 года, компания понимает, что продажи шерстяной одежды увеличиваются зимой и резко сокращаются летом. Следовательно, он может лучше управлять запасами одежды на следующий год.

Анализ временных рядов состоит из четырех основных компонентов: тенденции, сезонность, цикл и вариация.

Тренды.Одним из компонентов анализа временных рядов является тренд, который показывает, движется ли в долгосрочном периоде функция, для которой выполняется анализ, вверх или вниз или является нелинейным. Тенденция может быть линейной или нелинейной. Конкретный временной ряд события можно назвать трендом только в том случае, если анализ проводится в течение длительного времени.

Сезонность. Краткосрочные изменения временных рамок являются сезонным компонентом анализа временных рядов. Обычно сезонная часть анализируется в течение 12 месяцев или меньше. На изображении ниже видно, что продажи купальных костюмов значительно увеличиваются с марта по апрель, а затем значительно падают после июля. Эта сезонная тенденция продаж купальных костюмов демонстрирует более высокие продажи купальных костюмов летом. Естественные причины обычно влияют на сезонный компонент временных рядов; в некоторых случаях регулярно проводимое искусственное мероприятие также играет жизненно важную роль.

Цикл.Циклические вариации — это вариации временных рядов, которые возникают независимо друг от друга и длятся дольше года. Такие существенные временные колебания часто длятся дольше года. Циклическое изменение обычно вызывается искусственным фактором, в первую очередь экономическим. Важной чертой циклических изменений является то, что они повторяются, но являются непериодическими. Основное различие между циклическим и сезонным компонентами заключается в периодическом характере сезонного компонента и непериодическом компоненте цикла. Например, продажи купальных костюмов будут увеличиваться каждое лето, поскольку более высокая температура характерна для периода с апреля по июль. Кроме того, в течение нескольких лет на фондовом рынке будет период бычьего и медвежьего периодов; оба времени специфичны, но временные рамки от бычьего к медвежьему могут варьироваться. Следовательно, во время бума продажи одежды значительно увеличатся, а во время рецессии общий объем продаж одежды упадет.

Вариация. Вариация — это, по сути, шум в данных. Движение, которое нельзя предсказать и которое вызвано фактором, не находящимся под контролем, обычно вызывает вариацию. Например, июньские грозы в том или ином году могут значительно снизить продажи купальных костюмов. Вариации обычно не очень важны для прогнозирования, но они существуют как выбросы в данных.

Термин «анализ временных рядов» много раз используется вместо регрессии и многими считается одинаковым. Но между регрессией и анализом временных рядов есть существенная разница. Данные временных рядов тесно коррелированы с параметром времени. Например, когда у нас есть данные о фондовом рынке, и мы пытаемся спрогнозировать акции, данные имеют временную метку и сильно коррелируют со временем. Следовательно, это проблема анализа временных рядов. Но когда мы прогнозируем цены продажи дома, различные переменные предсказывают цену дома. Время также является одной из переменных, но другие переменные играют жизненно важную роль, и корреляция со временем незначительна; этот метод также известен как интерполяция. Регрессионный анализ — это математический способ найти связь между двумя переменными. В то же время анализ временных рядов — это математический способ найти связь одной переменной со временем.

В анализе временных рядов прогнозы сильно зависят от прошлых данных, обычно называемых запаздыванием. Например, если кто-то пытается спрогнозировать рыночную стоимость той или иной компании, он должен иметь данные по показателям ключ-стоимость за последние много лет. Чем больше исторических данных, тем лучше анализ временных рядов. Это одна из слабых сторон анализа временных рядов; метод требует исторических данных (авторегрессионная динамика) для прогнозирования будущего; этот метод также известен как экстраполяция. Поскольку анализ сильно зависит от времени, анализ требует огромного количества исторических данных, чтобы предсказать будущее интересующей функции. Напротив, модели регрессии зависят от признаков (одиночных/множественных) независимо от времени; следовательно, даже данные меньшего периода времени могут дать лучшие результаты, чем анализ временных рядов, имеющий больше исторических данных.

На изображении выше я создал диаграмму данных о продажах для гипотетической компании за десять лет. Линия наилучшего соответствия показывает корреляцию продаж (вызванную несколькими факторами) со временем. Линия наилучшего соответствия начинается выше 100 и перемещается примерно к 96. Следовательно, в соответствии с линией наилучшего соответствия можно прогнозировать продажи в следующем году в пределах 96–100 единиц.

На изображении выше видно, что продажи резко выросли в 2019 году и значительно выросли в 2020 году. В регрессионном анализе для прогнозирования учитываются исторические данные. Прошлые данные известны как Запаздывание в анализе временных рядов. Следовательно, если запаздывание считается двумя единицами и 2020 равно t, тогда 2019 равно t-1, а 2018 равно t-2. Поэтому продажи в 2019 году составили 80, а продажи в 2018 году — 100. Согласно анализу двух последних лагов, наблюдается падение продаж на 20 единиц; после этого отставания в 2020 году должно произойти снижение еще на 20 единиц, и анализ должен предсказать продажи в 2020 году как 60, но данные о реальных продажах на диаграмме показывают продажи в 105, что ближе к данным, обозначенным по наиболее подходящей линии в регрессионном анализе. Следовательно, для анализа временных рядов требуется огромное количество исторических данных (запаздывание).

Ссылки:

Графики можно создавать на: https://statscharts.com/line/linechart

Очень полезное видео, чтобы понять разницу между временными рядами и регрессией: https://www.youtube.com/watch?v=whmI0WHuIK4

Не стесняйтесь связаться со мной на Linkedin: https://www.linkedin.com/in/aaryabrahmane11/

Счастливого обучения!

Мир!

Подпишитесь на DDIntel Здесь.

Посетите наш сайт здесь: https://www.datadriveninvestor.com

Присоединяйтесь к нашей сети здесь: https://datadriveninvestor.com/collaborate