Национальная баскетбольная ассоциация (НБА) — это ведущая мировая баскетбольная лига, в которой лучшие спортсмены соревнуются на экстраординарном уровне за победу и славу. Лучшие из этих игроков внесены в Зал баскетбольной славы Мемориала Нейсмит, где их наследие живет вечно.

Но не каждый может войти; следовательно, обсуждение этого вида спорта изобилует интенсивными спорами о H.O.F. игроки калибра, особенно нынешние игроки, которые не имеют права на рассмотрение, пока они полностью не уйдут на пенсию в течение трех сезонов. Будучи давним фанатом баскетбола, я попытался создать модель, которая предсказывает вероятность попадания игрока в Зал славы на основе нескольких статистических данных и наград. Хотя он далек от совершенства и не является исчерпывающим определением судьбы игрока, я считаю, что анализ того, как исторически выбирались члены Зала славы, и применение этого прецедента к современной НБА, может принести большую пользу. Давайте начнем:

Модель:

Я использую Python вместе с несколькими библиотеками, способствующими обработке данных для этого проекта, а именно NumPy, Pandas, statsmodels и scikit-learn. Чтобы эта модель была эффективной, требуется набор данных.

Я буду использовать модель классификации логистической регрессии для этого проекта. Этот тип регрессии чаще всего используется в машинном обучении для расчета вероятности возникновения события на основе нескольких независимых переменных. Как видно на изображении выше, выход этой функции всегда находится между 0 и 1, что позволяет легко получить вероятности и сделать обучение с учителем (использование существующих данных с известными результатами для повышения точности модели) эффективным. Статистические модели библиотеки Python предоставляют простой способ применения этого типа регрессии к данным. Обучение модели для определения вероятности того, что игрок будет принят в H.O.F. требует несколько функций, чтобы быть эффективным. Таким образом, я решил включить в свои тренировочные данные следующие статистические данные:

  • Очки за игру (PPG)
  • Количество передач за игру (APG)
  • Подборов за игру (RPG)
  • Матч всех звезд (ASG)
  • Выбор команды All-NBA (AllNBA)
  • Выбор команды защиты All-NBA (AllDefense)
  • Награды самому ценному игроку (MVP)
  • Награда лучшему защитнику года (DPOY)
  • Награды самому ценному игроку финала (FMVP)
  • Количество выигранных чемпионатов
  • Выигрышные акции (WS)

Важно отметить, что эта модель может делать прогнозы только на основе доступных в настоящее время данных; другими словами, что игрок на самом деле сделал к этому моменту. Это означает, что молодые игроки, такие как Зайон Уильямсон, могут быть не оценены так высоко, как ожидалось, даже если широко распространено мнение, что эти игроки в конечном итоге сделают потрясающую карьеру, достойную H.O.F.

Сбор данных:

Во-первых, я использовал Баскетбольный набор данных Уайетта Уолша, чтобы собрать базовую статистику для каждого неактивного (и, следовательно, имеющего право на участие в H.O.F.) игрока в истории НБА. Это включает в себя средние показатели очков, подборов и передач за игру. Справочник по баскетболу предоставил точные данные о Выборе всех звезд, Выборе всех команд НБА, Самых ценных игроках-победителях, Победителях в номинации «Лучший защитник года, Долях побед, Выборе всех оборонительных команд, и Победители финала «Самый ценный игрок. Наконец, Land Of Basketball.com предоставил список всех игроков, выигравших как минимум два чемпионата. Конечно, есть много известных действующих игроков, которые выиграли только один чемпионат, поэтому я вручную добавил их в конец существующего набора данных.

Land Of Basketball.com также предоставляет отличную таблицу всех игроков НБА, которые были введены в H.O.F.: H.O.F. статус игрока будет неотъемлемой частью эффективности модели, так как это будет метка.

После создания набора данных и очистки его от недопустимых записей данных с помощью Pandas в Python можно начинать обучение модели.

Обучение модели:

Statsmodels делает обучение модели на Python интуитивно понятным и простым, поэтому я использовал его функцию логистической регрессии. В процессе обучения любой модели машинного обучения полезно разбивать данные на обучающий набор и тестовый набор, чтобы модель могла «попрактиковаться» на сторонних данных, а ее точность можно было наблюдать перед развертыванием. С помощью функции train_test_split от sklearn я выделил 75% данных для обучения, а оставшиеся 25% — для тестирования. Наконец, функции этого проекта — это все вышеупомянутые статистические данные в предыдущем разделе, а метка — это то, был ли игрок введен в должность в H.O.F. Отбросив эту информацию, давайте посмотрим на результаты.

Результаты:

Я собрал список всех нынешних игроков НБА, которые были выбраны по крайней мере в одну звездную команду, чтобы данные были уточнены для игроков с законным статусом H.O.F. резюме. Всего в этот список попало 73 игрока. После запуска всего набора данных через модель результаты следующие:

Интересно, что только у двух игроков есть абсолютный, 100-процентный шанс попасть в Зал славы:

  • Леброн Джеймс
  • Крис Пол

То, что Леброн Джеймс занимает первое место в лиге, неудивительно. Он, возможно, лучший игрок всех времен; немногие сравнимы с ним по долголетию, и его устойчивое величие на протяжении всей его карьеры никогда не было замечено прежде. Это отражено в его невероятной статистике.

Меня также очень интригует Крис Пол, опередивший нескольких других игроков в этом списке. Хотя он, в частности, никогда не выигрывал чемпионат, его награды и статистика по-прежнему ясно доказывают, что его легендарная карьера достойна Зала славы.

Следующие 5 участников списка, без сомнения, сами по себе являются легендами и членами Зала славы. Кевин Дюрант и Стивен Карри были вторым и третьим игроками этого поколения баскетболистов НБА (порядок субъективно);Дуайт Ховард, несмотря на свою бурную репутацию, имеет долгую карьеру, отмеченную его суперзвездой в Орландо и его способностью адаптироваться в качестве ролевого игрока с несколькими конкуренты в 2010-х, а именно Хьюстон и Лос-Анджелес; Джеймс Харден в нападении полностью разорвал лигу на части в эпоху, когда на поле доминировали «Голден Стэйт Уорриорз»; Рассел Уэстбрук, возможно, самый спортивный разыгрывающий всех времен, и в среднем делал трипл-дабл, когда это считалось невозможным.

Самым большим недостатком моей модели является ее неспособность ощутить качественное влияние, которое оказал игрок, или если часть карьеры игрока была омрачена травмами или проблемами вне корта. Кавай Леонард, например, является членом Зала Славы почти по всем параметрам, приведя две разные франшизы к чемпионству и выиграв два MVP финала в обеих этих сериях соответственно. , а также создать несколько команд All-NBA и All-Defensive и даже дважды выиграть награду DPOY. Однако похоже, что годы, которые он пропустил из-за травмы и разногласий с руководством в Сан-Антонио, исказили данные о траектории его карьеры. Еще один заметно отсутствующий игрок в этом списке — Клэй Томпсон, ключевая фигура в четырех чемпионских командах «Голден Стэйт Уорриорз». Согласно модели, у него всего 82,76% шансов быть введенным в должность в H.O.F., и все же большинство фанатов, несомненно, считают его членом Зала славы за его вклад.

При этом я также считаю, что есть 2 игрока, которые оцениваются моделью слишком высоко; Блейк Гриффин и Лука Дончич. Мне, как студенту Университета Оклахомы и убежденному болельщику «Маверикс», трудно критиковать этих игроков, однако ни один из них не принадлежит к этому высокому уровню. Гриффин был феноменальным спортсменом в расцвете сил, внесшим огромный вклад в успех «Лоб Сити Лос-Анджелес Клипперс» в начале 2010-х, но тогда его игра была относительно одномерной. После того, как его обменяли в Детройт, он продолжал продюсировать, пока травмы в конечном итоге не опустили его на его нынешнюю позицию ролевого игрока в претенденте на титул. Я считаю, что его похвалы, особенно выборы в Матчи звезд и отборы в Матч всех НБА, являются основной причиной его рейтинга, однако я сомневаюсь в том, что его шансы быть введенным в должность в H.O.F. лучше, чем такие игроки, как Кайри Ирвинг, Дрэймонд Грин, Кавай Леонард, Клэй Томпсон, Кевин Лав и даже Никола Йокич. Лука Дончич, с другой стороны, ясно продемонстрировал, что он H.O.F. калибра, став, возможно, одним из 5 лучших игроков на планете в молодом возрасте 23 лет. Его статистика на этом этапе его карьеры абсурдна, но, имея за плечами всего 4 сезона, шанс попасть в H.O.F. составляет почти 91%. на данный момент нереально. Если бы эта модель включала данные о международных играх, Дончич, вероятно, был бы игроком H.O.F. в этот самый момент просто из-за его монументальных достижений в Европе в подростковом возрасте, но на данный момент включены только данные NBA.

В целом, большинство вероятностей в некоторой степени точны и, по крайней мере, отражают иерархию великих игроков НБА всех времен, которые в настоящее время играют в лиге.

Вердикт:

Модель, которую я разработал, по-прежнему несовершенна в некоторых очевидных аспектах, однако, несмотря на то, что она опирается на количественные оценки обучения, она создала впечатляющую систему оценок. Обучение модели распознаванию культурного влияния игрока — важный шаг, который я предприму для повышения ее точности, а также нормализации данных и попытки определить гиперпараметры, которые помогут уточнить классификацию.

При этом избрание в Зал славы зависит от мнения нескольких избирателей в спортивных СМИ, а не от компьютерного алгоритма. Эта модель не может думать как избиратели, однако, используя предыдущие выборы, можно проанализировать, что прецедент делает очевидным в процессе голосования.

Для тех, кто заинтересован, вот полные результаты для каждого из 73 действующих игроков, которые были отобраны в звездную команду.