Міри центральної тенденції

Дата публикации:  17 мая

Міра центральної тенденції - це число, що характеризує вибірку за рівнем вираженості виміряної ознаки. Вони показують, навколо яких значень групується більшість експериментальних даних.

Існує три способи визначення "центральної тенденції", кожному з яких відповідає своя міра: мода, медіана, вибіркове середнє.

Мода

Мода (Mo) - це таке значення з безлічі вимірів, яке зустрічається найчастіше. Моді, або модальному інтервалу ознаки, відповідає найбільший підйом (вершина) графіку розподілу частот. Якщо графік розподілу частот має одну вершину, то такий розподіл називається унімодальним.

Коли два сусідніх значеня зустрічаються однаково часто і частіше ніж будь-яке інше значення, модою є середнє цих двох значень.

Розподіл може і не мати моду. Коли все значення зустрічаються однаково часто, прийнято вважати, що такий розподіл не має моди.

Приклад:

Припустимо у нас є ряд значень {4,5,8,2,6,5} мода цих значень буде дорівнює 5.

Або у нас є інший ряд {4,3,1,8,9,0,6,1,9}. У ньому два числа зустрічаються однакову кількість разів - це 1 і 9. Тоді мода цієї вибірки буде 5, тому, що це середнє значення між числами 1 і 9.

Ну а в цьому ряду значень {1,8,4,8,0,0,1,4} моди немає, тому що всі значення зустрічаються однакову кількість разів.

Медіана

Медіана (Me) - це таке значення ознаки, яке ділить впорядковану (ранжовану) безліч даних навпіл так, що одна половина всіх значень менше медіани, а інша - більше. Таким чином, першим кроком при визначенні медіани є упорядкування (ранжування) всіх значень за зростанням або спаданням. Далі медіана визначається наступним чином:

  • якщо дані містять непарне число значень, то медіана - це центральне значення;
  • якщо дані містять парне число значень, то медіана - це точка, посередині між двома центральними значеннями.

Приклад:

Припустимо у нас є ряд значень з непарною кількістю елементів {1,7,3,9,2,6,0}, щоб дізнатися медіану нам потрібно спочатку впорядкувати значення за зростанням або спаданням. Наприклад, ось так - {0,1,2,3,6,7,9}. Тепер наочно видно, що мода дорівнює 3, тому що це центральне значення вибірки.

Або, припустимо, у нас є ряд з парною кількістю елементів {5,9,2,7,7,4,0,1}. Упорядковуємо значення {0,1,2,4,5,7,7,9}. Медіана цього ряду перебуває між значеннями 4 і 5. Значить, нам потрібно розрахувати середнє для цих значень. Отримуємо 4,5.

Вибіркове середнє

Оскільки в психологічних дослідженнях ми досліджуємо вибірки, нам і середнє треба розраховувати за вибіркою або - вибіркове середнє. Вибіркове середнє (емпіричне середнє), є окремим випадком середнього арифметичного і визначається як сума всіх значень виміряної ознаки, поділена на кількість підсумованих значень.

\( \bar{X}=\frac{1}{n}\sum_{i=1}^nX_i \)

Приклад: припустимо у нас є вибірка значень {3,4,5,6,7}. Підставляємо ці значень в формулу, де n це кількість значень і для нашої вибірки воно дорівнює 5, ми отримаємо:

\( \bar{X}=\frac{3+4+5+6+7}{5}=\frac{25}{5}=5 \)

Хоча середнє арифметичне часто використовується в якості середніх значень або центральних тенденцій, це поняття не відноситься до робастних статистик, тобто на середнє арифметичне мають сильний вплив "великі відхилення". Примітно, що для розподілів з великим коефіцієнтом асиметрії середнє арифметичне може не відповідати поняттю "середнього", а значення середнього з робастной статистики, наприклад, медіана, може краще описувати центральну тенденцію.

Класичним прикладом є підрахунок середнього доходу. Арифметичне середнє може бути неправильно витлумачено як медіана, через що може бути зроблений висновок, що людей з великим доходом більше, ніж є насправді. "Середній" дохід тлумачиться таким чином, що доходи більшості людей знаходяться поблизу цього числа. Але цей "середній" дохід є вище, ніж доходи більшості людей, оскільки дуже високий дохід з великим відхиленням від середнього робить сильний перекіс середнього арифметичного. На відміну від цього, середній дохід за медіаною "пручається" такого перекосу. Однак цей "середній" дохід нічого не говорить про кількість людей поблизу медіанного доходу і не говорить нічого про кількість людей поблизу модального доходу. Проте якщо легковажно віднестися до понять "середнього" і "більшості", то можна зробити неправильний висновок про те, що більшість людей мають доходи вище, ніж вони є насправді.

Наприклад: розглянемо вибірку {1, 2, 2, 2, 3, 9}. Середнє арифметичне одно 3.17. Але ж п'ять значень з шести нижче цього середнього.

У симетричного одновимірного унімодального розподілу вибіркове середнє, медіана і мода однакові.