Показатели центра распределения | это... Что такое Показатели центра распределения? (original) (raw)

Для определения средних или наиболее типичных значений совокупности используются показатели центра распределения. Основные из них — математическое ожидание, среднее арифметическое, среднее геометрическое, среднее гармоническое, степенные средние, взвешенные средние, центр сгиба, медиана, мода.

Расчёт средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.

У симметричного одномерного унимодального распределения математическое ожидание, медиана и мода одинаковы.

Математическое ожидание

\operatorname M \xi = \int x f_\xi(x)\, dx.

В зарубежной литературе применяется обозначение \mathbb E \,\xi.

В статистике применяется выборочное среднее:

\bar{X} = \frac{1}{n} \sum\limits_{i=1}^n X_i.

Преимущества: если эксперимент повторяется многократно, а результаты суммируются (например, в страховании, азартных играх), математическое ожидание — естественный выбор.

Недостатки: не соответствует интуитивному пониманию «среднего»; меньшинство с аномальными значениями (долгожители, миллиардеры, бракованные изделия и т. д.) серьёзно смещают матожидание. В статистических расчётах рекомендуется отбрасывать такой «хвост».

Медиана

У одномерного распределения медиана — квантиль уровня 0,5. То есть, такое число m, что \operatorname P \{ \xi < m \} = 0{,}5. (Или \operatorname P \{ \xi < = m \} = 0{,}5.)

Преимущества: Медиана согласуется с интуитивным пониманием «среднего». К тому же, даже очень «дикие» выбросы изменяют медиану незначительно. Например, если к сотне бедняков (доходы равномерно распределены от 0 до 1 )добавитьодногомиллиардера(1млрд) добавить одного миллиардера (1 млрд )добавитьодногомиллиардера(1млрд), среднее сместится от 0,5 $ до 10 млн ,втовремякакмедиана—от0,5, в то время как медиана — от 0,5 ,втовремякакмедианаот0,5 до 0,505. Монотонная функция не изменяет медиану — для любой монотонной f(x) будет выполняться \operatorname {Med} \, f(\xi) = f ( \operatorname {Med} \, \xi).

Недостатки: плохо работает для многомерных распределений со сложной взаимосвязью компонентов. Сложна в расчёте.

Мода

Мода — точка, в которой плотность распределения имеет локальный максимум. Распределение может иметь несколько мод.

Преимущества: позволяет работать с данными нечисловой природы.

Недостаток: не учитывает поведение распределения в других точках.