Nano Hash - криптовалюты, майнинг, программирование

MYSQL - выберите пользователей с наибольшим количеством повторяющихся записей с конкретным пользователем

Моя таблица очень проста:

user_id , questionid , answerid (остальное не важно)

id  | user_id  | questionid |  answerid
====+==========+============+=============
  1 |     1    |       1    |  11
  2 |     1    |       2    |  14
  3 |     2    |       1    |  11
  4 |     2    |       2    |  14
  5 |     3    |       1    |  11
  6 |     3    |       2    |  16

Мне нужен список идентификаторов пользователей, которые имеют те же идентификаторы ответов, что и текущий (указанный) идентификатор пользователя, отсортированный по количеству одинаковых ответов.

В основном... список пользователей, которые ответили так же, как текущий пользователь на вопросы... с одинаковыми ответами.

список должен выглядеть так - для userid(1):

  • идентификатор пользователя (2) - 2
  • идентификатор пользователя (3) - 1

поэтому Userid 2 имеет 2 таких же ответа, как userid 1, а Userid 3 имеет 1 тот же ответ, что и userid 1.

Спасибо большое...


Ответы:


1

Это в основном left outer join между всеми пользователями и указанным пользователем. Если соединение прошло успешно, то ответ тот же.

select qa.user_id, count(qau.id) as SameAnswers
from qa left outer join
     qa qau
     on qau.user_id = XXX and
        qau.questionid = qa.questionid and
        qau.answerid = qa.answerid
group by qa.user_id
order by SameAnswers desc;

Обратите внимание, что эта мера количества одинаковых ответов не является очень хорошей мерой сходства, если только все пользователи не ответили на одни и те же вопросы.

21.01.2014
  • @HelFrozeOver . . . Это ответ на ваш вопрос. Мой комментарий — это всего лишь суждение о том, насколько полезна эта мера. 22.01.2014
  • Является ли ваш метод лучше, чем решение, которое в итоге сработало для меня лучше: выберите A.user_id, count(A.answerid) AS match_cnt from #__test as A join (выберите user_id, answerid из #__test, где user_id = '.mysql_real_escape_string($myid). ') как B в группе (A.answerid = B.answerid AND A.user_id ‹› B.user_id) по A.user_id в порядке match_cnt DESC 22.01.2014
  • @HelFrozeOver . . . Я думаю, что эти два метода очень похожи. Ваш использует подзапрос, который в MySQL влечет за собой накладные расходы на материализацию результатов. 22.01.2014
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..