Мода и медиана в статистике

Основной характеристикой центра распределения является среднее арифметическое, которое характеризуется тем, что все отклонения от него, положительные и отрицательные, складываются в ноль. Медиана характеризуется тем, что сумма ее отклонений по модулю минимальна, а мода представляет собой значение признака, который встречается наиболее часто.

Медиана характеризуется тем, что сумма ее отклонений по модулю минимальна, а мода представляет собой значение признака, который встречается наиболее часто.

Соотношение моды, медианы и среднего арифметического указывает на характер распределения признака в популяции и позволяет оценить его асимметричность. При симметричном распределении все три характеристики совпадают. Чем больше разница между модой и средней арифметической, тем более асимметричным является ряд.

Для умеренно асимметричных рядов разница между модой и средней арифметической примерно в три раза больше, чем разница между медианой и средним значением, т.е. разница между модой и медианой. Мода и медиана в интервальном ряду могут быть определены графически. Мода определяется по гистограмме распределения. Для этого выбирается самый верхний прямоугольник, который в данном случае является модальным прямоугольником.

Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника с левым верхним углом последующего прямоугольника. Из точки их пересечения опустите перпендикуляр к оси абсцисс. Абсцисса точки пересечения этих линий будет модой распределения Рис. Графическое определение моды по гистограмме. Затем из точки пересечения опускается перпендикуляр на ось абсцисс.

Ось абсцисс точки пересечения является медианой. Квартили, децили и перцентили Аналогично нахождению медианы в вариационном ряду распределения, можно найти значение признака в любой единице ранжированного ряда.

Так же, как и при нахождении медианы, можно найти значение признака в любой единице ранжированного ряда.

Так, например, мы можем найти значение признака в единицах, которые делят ряд на четыре равные части, на 10 или на доли. Эти значения называются квартилями, децилями и процентилями. Квартили представляют собой значение признака, которое делит ранжированную совокупность на 4 равные части. Средний квартиль Q 2 является медианой. Рассмотрим расчет нижнего и верхнего квартилей по данным таблицы.

Исходя из этого, получаем: , . Кроме квартилей в вариационных рядах могут быть определены децили - варианты, делящие ранжированный вариационный ряд на десять равных частей. Они рассчитываются по формулам: ,. Значения признака, которые делят ряд на сто частей, называются перцентилями. Соотношения медиан, квартилей, децилей и перцентилей показаны на рис.

Средние позиционные значения признака - это средние значения, занимающие определенное положение в ранжированном вариационном ряду. Мода Мо - это значение признака, которое встречается наиболее часто в изучаемой популяции.

Для дискретных позиционных средних - это значение признака, которое встречается наиболее часто в изучаемой популяции.

Для дискретного вариационного ряда значение вариантов с наибольшей частотой будет модой Пример. Определите моду по имеющимся данным в таблице 7. Используя данные таблицы В, сначала определите модальный интервал, то есть интервал с наибольшей частотой в случае равноинтервального распределения интервалов, а интервал с неравноинтервальным распределением - по наибольшей плотности.

Мода - это примерно середина модального интервала. Моду определяем по формуле: лет. Название медиана взято из геометрии, где оно обозначает отрезок, соединяющий одну из вершин треугольника с серединой противоположной стороны, тем самым делящий сторону треугольника на две равные части. Медиана Me - это значение признака, которое приходится на середину ранжированной совокупности.

Медиана - это значение признака, которое приходится на середину ранжированной совокупности.

Иными словами, медиана - это значение, которое делит совокупность упорядоченного вариационного ряда на две равные части - в одной части значения варьирующего признака меньше средней вариации, а в другой - больше. Для ранжированного ряда t. В дискретных вариационных рядах медиану находят по кумулятивной частоте, соответствующей порядковому номеру медианы или превышающей его в первый раз.

В дискретных вариационных рядах медиану находят по кумулятивной частоте, соответствующей порядковому номеру медианы или превышающей его.

В противном случае кумулятивная частота равна или впервые превышает половину суммы всех частот в ряду. Определите медиану по имеющимся данным в таблице. Способы их вычисления п. В этом примере мода и медиана совпадают, но они могут и не совпадать. В интервальном вариационном ряду определяются кумулятивные частоты, и по данным о кумулятивных частотах находят медианный интервал - интервал, в котором кумулятивная частота составляет половину или более половины общей суммы частот.

Формула для определения медианы в интервальном ряду распределения выглядит следующим образом:. В этом примере модальный и медианный интервал совпадают, но они могут и не совпадать. Модальный и медианный интервалы широко используются в различных областях экономики. Например, при расчете модальной производительности труда, модальной стоимости рабочей силы и т.д. Эту характеристику следует использовать для выявления резервов нашей экономики.

Модальность актуальна для решения практических задач. Например, при планировании массового производства одежды и обуви устанавливается модальный размер изделия, пользующийся наибольшим спросом. Мода может быть использована в качестве приближенной характеристики уровня изучаемого признака вместо средней арифметической, если распределение частот близко к симметричному и имеет одну непланарную вершину.

Медиану следует использовать в качестве среднего в случаях, когда нет достаточной уверенности в однородности изучаемой совокупности. На медиану влияют не столько сами значения, сколько количество случаев на определенном уровне. Следует также отметить, что медиана всегда конкретна при большом количестве наблюдений или при нечетном количестве членов популяции, так как Ме означает некоторый реальный действительный элемент популяции, тогда как среднее арифметическое часто принимает значение, которое не может принимать ни одна из единиц популяции.

Основным свойством Me является то, что сумма абсолютных отклонений значений признака от медианы меньше, чем любое другое значение:. Это свойство Ме может быть использовано, например, при определении местоположения общественных зданий, так как Ме определяет точку, дающую наименьшее расстояние, скажем, детских садов от места жительства родителей, жителей населенного пункта от кинотеатра, при проектировании остановок трамвая, троллейбуса и т.д.

В системе структурных показателей Ме - это сумма абсолютных отклонений значений признака от медианы.

В системе структурных показателей в качестве показателей особенностей формы распределения могут быть использованы варианты, занимающие определенное место в ранжированном вариационном ряду каждый четвертый, пятый, десятый, двадцать пятый и т.д.. Аналогично нахождению медианы в вариационном ряду можно найти значение признака в любой упорядоченной единице ранжированного ряда.

Квартиры - это значения признака, которые делят ранжированную совокупность на четыре равные части. Различают нижний квартиль Q 1 , средний квартиль Q 2 и верхний квартиль Q 3. Для расчета квартилей интервального ряда используют формулы: ;. Децили рассчитываются по той же схеме, что и медианы и квартили: ;. Использование вышеперечисленных характеристик при анализе вариационных рядов распределения позволяет глубоко и детально охарактеризовать изучаемую совокупность. Структура статистических совокупностей различна.

Чем симметричнее распределение единиц совокупности, тем качественнее однороднее ее состав по изучаемому признаку, тем лучше и надежнее средняя величина признака характеризует изучаемое явление. Но для случаев резкого перекоса асимметрия ряда распределения средней арифметической не столь характерна. Например, средний размер вкладов в сберегательных банках не представляет особого интереса, так как основная масса вкладов находится ниже этого уровня, а на среднюю величину существенное влияние оказывают крупные вклады, которые немногочисленны и не характерны для массы вкладов.

В таких случаях статистика использует другую систему - систему вспомогательных структурных средних. К ним относятся мода, медиана, а также квартили, квинтили, децили и перцентили. Мода Мо - это наиболее частое значение признака, а в дискретном вариационном ряду - вариант с наибольшей частотой.

В статистической практике мода Мо - это наиболее частое значение признака.

В статистической практике мода используется при изучении доходов населения, потребительского спроса, регистрации цен и при анализе некоторых технико-экономических показателей предприятий. В некоторых случаях интерес представляет именно мода, а не средняя арифметическая.

В статистической практике она используется вместо средней величины.

Иногда ее используют вместо средней арифметической, например, для характеристики структуры ряда распределения. Порядок определения моды зависит от вида ряда распределения. Если варьирующий признак представлен в виде дискретного ряда, то для определения моды не требуется никаких вычислений.

В таком ряду мода не нужна.

В таком ряду значение признака, которое имеет наибольшую частоту, будет модой. Медиана Ме - это значение признака, находящееся в середине ранжированного вариационного ряда, в котором отдельные значения вариационного признака расположены в порядке возрастания или убывания их ранга. Медиана используется в маркетинговой деятельности. Например, расположение элеваторов, первичных винодельческих, консервных заводов, сумма расстояний до которых от поставщиков сырья должна быть наименьшей.

Медиана, как и мода, определяется по-разному. Она зависит от структуры ряда распределения. Если число членов дискретного ряда нечетное, то медиана находится в середине ряда и делит ряд на две равные части в соответствии с числом членов ряда.

В интервальных рядах медиана находится в середине ряда и делит ряд пополам.

В интервальных сериях сначала определяется медианный интервал. Для этого, как и в случае дискретного ряда, вычисляется медианное число.

Суммарная частота, которая равна или первой превышает медианное число в интервальном вариационном ряду, соответствует медианному интервалу. Обозначим эту кумулятивную частоту через S Me. Медиана вычисляется по формуле: где - нижняя граница медианного интервала - значение медианного интервала - кумулятивная частота интервала, предшествующего медианному интервалу - частота медианного интервала Графическое определение моды и медианы Моду и медиану в интервальном ряду можно определить графически.

Из точки их пересечения на ось абсцисс опускается перпендикуляр. Медиана рассчитывается по кумулюсу рис. Затем из точки пересечения этой линии с кумулюсом опускается перпендикуляр на ось абсцисс. Показатели вариации в статистике. В процессе статистического анализа может возникнуть ситуация, когда значения средних величин совпадают, а совокупности, на основе которых они рассчитаны, состоят из единиц, значения признака которых довольно резко отличаются друг от друга.

В этом случае рассчитываются показатели вариации. Иванова М. Способы их расчета" Введение Средние величины и связанные с ними показатели вариации играют очень важную роль в статистике, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.


Навигация

Comments

  1. Великолепный пост, не часто встретишь такое глубокое понимание сути вопроса, постарайтесь писать почаще