Мода —это наиболее часто встречающееся значение в распределении.

Рассмотрим этот набор данных, показывающий пенсионный возраст 11 человек в целых годах:

54, 54, 54, 55, 56, 57, 57, 58, 58, 60, 60

Наиболее часто встречается значение 54, поэтому мода этого распределения — 54 года.

Преимущество режима:

Преимущество моды перед медианой и средним значением состоит в том, что ее можно найти как для числовых, так и для категориальных (нечисловых) данных.

Ограничения режима:

Существуют некоторые ограничения на использование режима. В некоторых распределениях мода может не очень хорошо отражать центр распределения. Когда распределение пенсионного возраста упорядочено от низшего к высшему значению, легко увидеть, что центр распределения находится в 57 лет, но мода ниже, в 54 года.

54, 54, 54, 55, 56, 57, 57, 58, 58, 60, 60

Также возможно наличие более одного режима для одного и того же распределения данных (бимодального или мультимодального). Наличие более чем одной моды может ограничивать способность моды в описании центра или типичного значения распределения, поскольку невозможно определить одно значение для описания центра.

В некоторых случаях, особенно когда данные непрерывны, распределение может вообще не иметь моды (т. е. если все значения различны).

В таких случаях может быть лучше рассмотреть возможность использования медианы или среднего значения или сгруппировать данные в соответствующие интервалы и найти модальный класс.

Медиана. Медиана – это среднее значение в распределении, когда значения расположены в порядке возрастания или убывания.

Медиана делит распределение пополам (по обе стороны от медианного значения находится 50% наблюдений). В распределении с нечетным числом наблюдений медианное значение является средним значением.

Глядя на распределение пенсионного возраста (которое имеет 11 наблюдений), медиана представляет собой среднее значение, равное 57 годам:

54, 54, 54, 55, 56, 57, 57, 58, 58, 60, 60

Когда распределение имеет четное количество наблюдений, медианное значение является средним значением двух средних значений. В следующем распределении два средних значения равны 56 и 57, поэтому медиана равна 56,5 годам:

52, 54, 54, 54, 55, 56, 57, 57, 58, 58, 60, 60

Преимущество медианы:

Медиана менее подвержена влиянию выбросов и перекосов данных, чем среднее, и обычно является предпочтительной мерой центральной тенденции, когда распределение несимметрично.

Ограничение медианы:

Медиана не может быть определена для категориальных номинальных данных, так как она не может быть логически упорядочена.

В таких ситуациях обычно предпочтительнее медиана, поскольку значение среднего может быть искажено выбросами. Однако это будет зависеть от того, насколько влиятельны выбросы. Если они существенно не искажают среднее значение, обычно предпочтительнее использовать среднее значение в качестве меры центральной тенденции.