Nano Hash - криптовалюты, майнинг, программирование

R - Как прогнозировать по группе для ежедневного временного ряда с несколькими переменными

Я новичок в прогнозировании таймсерий по группам.

У меня есть большой ежедневный набор данных таймсерий, для которого мне нужно делать прогнозы.

Я много гуглил и пробовал много разных способов, но безуспешно.

date    country device  os  browser visits  clicks  logins  sale
7/29/2018   USA desktop Windows Firefox 3046    1523    762 381
7/29/2018   USA mobile  Windows Firefox 6546    3273    1637    818
7/29/2018   USA tablet  Windows Firefox 864 432 216 108
7/30/2018   USA desktop Windows Firefox 11004   5502    2751    1376
7/30/2018   USA mobile  Windows Firefox 7938    3969    1985    992
7/30/2018   USA tablet  Windows Firefox 1114    557 279 139
7/31/2018   USA desktop Windows Firefox 10814   5407    2704    1352
7/31/2018   USA mobile  Windows Firefox 7560    3780    1890    945
7/31/2018   USA tablet  Windows Firefox 984 492 246 123

Это пример набора данных, который я создал, так как не смог найти другой открытый набор данных, который мог бы правильно представить мою проблему. (извинения, если номера образцов плохие)

Я хочу спрогнозировать ежедневные «посещения», «клики», «входы», «продажи» на следующие «n» дней в этом наборе данных по «стране», «устройству», «ОС» и «браузеру».

Любая помощь будет высоко ценится.


Ответы:


1

Это именно тот вариант использования, для которого мы разрабатываем пакеты tsibble и fable. tsibble находится в CRAN (https://cran.r-project.org/package=tsibble), а fable по-прежнему находится только на github (https://github.com/tidyverts/fable).

Вы можете сделать что-то вроде этого, чтобы прогнозировать clicks на country, device, os и browser:

library(tsibble)
library(fable)
mydata <- tsibble(dataframe, key = c(country, device, os, browser), index=date)
mydata %>%
  model(ETS(clicks)) %>%
  forecast()
28.10.2018
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..