Меры центральной тенденции

Редактор 17 мая

Мера центральной тенденции - это число, характеризующее выборку по уровню выраженности измеренного признака. 

Существует три способа определения "центральной тенденции", каждому из которых соответствует своя мера: мода, медиана, выборочное среднее.

Мода

Мода - это такое значение из множества измерений, которое встречается наиболее часто. Моде, или модальному интервалу признака, соответствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным. 

Когда два соседних значений встречаются одинаково часто и чаще чем любое другое значение, мода есть среднее этих двух значений.

Распределение может и не иметь моду. Когда все значения встречаются одинаково часто, принято считать, что такое распределение не имеет моды.

Пример:
Допустим у нас есть ряд значений {4,5,8,2,6,5} мода этих значений будет равна 5.
Или у нас есть другой ряд {4,3,1,8,9,0,6,1,9}.  В нем два числа встречаются одинаковое количество раз - это 1 и 9. Тогда мода этой выборки будет 5, потому, что это среднее значение между числами 1 и 9.
Ну а в этом ряду значений {1,8,4,8,0,0,1,4} моды нет, т.к. все значения встречаются одинаковое количество раз.

Медиана

Медиана - это такое значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений меньше медианы, а другая - больше. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом: 

  • если данные содержат нечетное число значений, то медиана - это центральное значение;
  • если данные содержат четное число значений, то медиана - это точка, посредине между двумя центральными значениями. 
Пример:
Допустим у нас есть ряд значений с нечетным количеством элементов {1,7,3,9,2,6,0}, чтобы узнать медиану нам нужно сначала упорядочить значения по возрастанию или убыванию. Например, вот так - {0,1,2,3,6,7,9}. Теперь наглядно видно, что мода равна 3, потому что это центральное значение выборки.
Или, допустим, у нас есть ряд с четным количеством  элементов {5,9,2,7,7,4,0,1}. Упорядочиваем значения {0,1,2,4,5,7,7,9}. Медиана этого ряда находиться между значениями 4 и 5. Значит, нам нужно рассчитать среднее для этих значений. Получаем 4,5. 

Выборочное среднее

Т.к. в психологических исследованиях мы исследуем выборки, нам и среднее надо расчитывать по выборке или - выборочное среднее. Выборочное среднее (эмпирическое среднее), является частным случаем среднего арифметического и определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений. 

 \( \bar{X}=\frac{1}{n}\sum_{i=1}^nX_i \) 

Пример:  допустим у нас есть выборка значений {3,4,5,6,7}. Подставляем эти значений в формулу, где n это количество значений и для нашей выборки оно равно 5, мы получим:

 \( \bar{X}=\frac{3+4+5+6+7}{5}=\frac{25}{5}=5 \) 

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, то есть среднее арифметическое подвержено сильному влиянию "больших отклонений". Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию "среднего", а значения среднего из робастной статистики, например, медиана, может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. "Средний" доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Но этот "средний" доход является выше, чем доходы большинства людей, так как очень высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического. В отличие от этого, средний доход по медиане "сопротивляется" такому перекосу. Однако этот "средний" доход ничего не говорит о количестве людей вблизи медианного дохода и не говорит ничего о количестве людей вблизи модального дохода. Тем не менее если легкомысленно отнестись к понятиям "среднего" и "большинства", то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например: рассмотрим выборку {1, 2, 2, 2, 3, 9}. Среднее арифметическое равно 3.17.  Но ведь пять значений из шести ниже этого среднего.

У симметричного одномерного унимодального распределения выборочное среднее, медиана и мода одинаковы.

Теги: