Nano Hash - криптовалюты, майнинг, программирование

Сегментация клиентов с помощью кластеризации

Я новичок в науке о данных, и у меня есть более теоретический вопрос об алгоритме кластеризации k-средних (или любом другом). На данный момент я пытаюсь сделать сегментацию клиентов на основе поведенческих данных. Мы разработали несколько атрибутов, таких как: - процент, на который клиент покупает товары по распродаже, - среднее количество товаров за раз, - средняя цена за продукт, - частота покупки товаров в магазине - и некоторые другие.

Мы пытаемся создать группы клиентов, которые ведут себя одинаково, чтобы мы могли общаться с ними на основе их предпочтений. Проблема в том, что я не уверен, дают ли результаты кластеризации правильные сегменты, с которыми мы можем работать. Вероятно, это определит другие кластеры, которые хороши для сопоставимого поведения, но не для практического использования.

Мой вопрос заключается в следующем; было бы лучше использовать алгоритм классификатора, чтобы я мог определить целевую переменную, или мне следует использовать алгоритм кластеризации? И если мне нужно выбрать алгоритм кластеризации, не будет ли лучше уменьшить количество атрибутов, чтобы у меня было немного больше контроля над тем, как будут выглядеть результаты?

Я надеюсь, что вы, ребята, поможете мне с этим концептуальным вопросом.


Ответы:


1

Если вы можете использовать классификацию, всегда используйте классификацию.

Кластеризация является хрупкой и не очень четко определенной проблемой. Вы не хотите строить бизнес на алгоритмах кластеризации.

13.02.2017
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..