Nano Hash - криптовалюты, майнинг, программирование

Кластеризация временных событий

У меня есть вопрос о выполнении кластеризации с облаками точек, в которых одно измерение, представляющее время, в некоторой степени защищено.

Чтобы было понятно, рассмотрим это видео.

cloud_of_points

Невооруженным глазом можно увидеть несколько плотных облаков, летающих, как комары, они могут представлять собой несколько вещей, которые входят в сцену и покидают ее. Теперь предположим, что у нас есть массив трехмерных точек (x, y, время) и мы применяем некоторую наивную кластеризацию (скажем, DBSCAN).

кластеризация

Теперь кластеризация неплохая, за исключением того, что события встречи рассматриваются в одном кластере, имея X-траектории. Теперь, если бы существовал способ трактовать третью координату по-другому, возможно, можно было бы восстановить основную истину. Какие алгоритмы лучше всего подходят для этой задачи?


Ответы:


1

Существуют основанные на плотности потоковые варианты DBSCAN.

Они должны решить в точности ваш сценарий, когда кластеры медленно движутся с течением времени, а кластеры появляются и исчезают.

Однако меня не убеждают все эти "потоковые" методы. Похоже, что они не используют никаких реальных данных, а только смоделированные и неестественные потоки, такие как «покерные руки».

09.08.2017
  • Есть ли в Интернете код для этих алгоритмов? Возможно, реализовано в библиотеках типа SKLearn? Я хочу проверить это на своих данных. Большое тебе спасибо! 10.08.2017
  • Вы заглянули в пакет R stream? Примеры в документации очень похожи на приведенные выше. 10.08.2017
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..