Вычисление медианы набора чисел. Как появилось понятие о среднем значении
Для характеристики рядов распределения (структуры вариационных рядов), наряду со средней, используются т. н. структурные средние : мода и медиана . Мода и медиана наиболее часто используются в экономической практике.
Мода - варианта, которая наиболее часто встречается в ряду распределения (в данной совокупности).
В дискретных вариационных рядах мода определяется по наибольшей частоте. Предположим товар А реализуют в городе 9 фирм по следующим ценам в рублях:
44; 43; 44; 45; 43; 46; 42; 46;43. Так как чаще всего встречается цена 43 рубля, то она и будет модальной.
При характеристике социальных групп населения по уровню дохода следует использовать модальное значение, нежели среднее. Средняя будет занижать одни показатели и завышать другие - тем самым осредняя (уравнивания) доходы всех слоев населения.
В интервальных вариационных рядах моду определяют приближенно по формуле:
ХМ0 - нижняя граница модального интервала;
h Mo - величина (шаг, ширина) модального интервала;
f 1 - локальная частота интервала, предшествующего модальному;
f 2 - локальная частота модального интервала;
f 3 - локальная частота интервала, следующего за модальным.
Распределение населения по уровню среднедушевого месячного дохода
Интервал 1000-3000 в данном распределении будет модальным, т.к. он имеет наибольшую частоту (f=35,5). Тогда по вышеуказанной формуле мода будет равна:
На графике (гистограмме распределения) моду определяют следующим образом: по оси ординат откладывают локальные частоты, а по оси абсцисс -интервалы либо центры интервалов. Выбирают самый высокий столбик, которому соответствует величина признака с наибольшей частотой в ряду распределения.
Мода применяется для решения некоторых практических задач. Так, например, при изучении товарооборота рынка берется модальная цена, для изучения спроса на обувь, одежду используют модальные размеры обуви и одежды.
Медиана - это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой , т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый номер медианы будет определяться по формуле (n+1):2 для рядов, где n - нечетное . Если же ряд с четным числом единиц, томедианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.
В дискретных вариационных рядах с нечетным числом единиц совокупности - это конкретное численное значение в середине ряда.
Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианного интервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.
X Me -нижняя граница медианного интервала
h Me -величина медианного интервала;
S Me-1 -сумма накопленных частот интервала, предшествующего медианному интервалу;
f Me -локальная частота медианного интервала.
По данным таблицы определим медианное значение среднедушевого дохода. Для этого необходимо определить какой интервал будет медианным. Используем формулу номера медианной единицы ряда, т.е. середины:
Дробное значение N (всегда при четном числе членов) равное 50,5% говорит о том, что середина ряда находится между 50% и 51%, т.е. в третьем интервале. Иными словами: медианным считается интервал, на который впервые приходится более половины суммы накопленных частот. Отсюда медиана:
Для того, чтобы определить графически интервал, в котором находится медиана, по оси ординат откладывают накопленные частоты, а по оси абсцисс - центры интервалов. Из точки на оси ординат, которой соответствует 50.5% суммы накопленных частот, проводят линию параллельно оси абсцисс до пересечения с кумулятой. Из точки пересечения опускают перпендикуляр на ось абсцисс.
Соотношение
моды, медианы и средней арифметической
указывает на характер распределения
признака в совокупности, позволяет
оценить его асимметрию.
Если M 0 Из
соотношения этих показателей следует
сделать вывод о правосторонней асимметрии
распределения населения по уровню
среднедушевого денежного дохода: Квартиль
–это
четвертая часть совокупности, определяется
как и медиана, только сумму частот
необходимо разделить на 4, а при
определении квартильного интервала,
кумулятивная частота должна быть больше
или равна четверти суммы частот
совокупности. Дециль
–
делит совокупность на десять равных
частей. Определяется аналогично как и
квартиль, только сумму частот необходимо
разделить на 10. Мода на экране, медиана в треугольнике, а средние – это температура по больнице и в палате. Продолжаем наш практический курс занимательной статистики
(Занятие 1)
изучением центральных характеристик статистической совокупности
, названия которых вы видите в заголовке. И начнём мы с его конца, поскольку о средних величинах
речь зашла практически с первых же абзацев темы. Для подготовленных читателей оглавление
: ну а «чайникам» лучше ознакомиться с материалом по порядку: Итак, пусть исследуется некоторая генеральная совокупность
объёма , а именно её числовая характеристика , не важно, дискретная
или непрерывная
(Занятия 2, 3
). Генеральной средней
называется среднее арифметическое
всех значений этой совокупности: Если среди чисел есть одинаковые (что характерно для дискретного ряда
)
, то формулу можно записать в более компактном виде: Живой пример вычисления генеральной средней
встретился в Примере 2
, но чтобы не занудничать, я даже не буду напоминать его содержание. Далее. Как мы помним, обработка всей генеральной совокупности часто затруднена либо невозможна, и поэтому из неё организуют представительную
выборку объема
, и на основании исследования этой выборки делают вывод обо всей совокупности. Выборочной средней
называется среднее арифметическое
всех значений выборки: Выборочная средняя позволяет достаточно точно оценить истинное значение , чего вполне достаточно для многих исследований. При этом, чем больше выборка, тем точнее будет эта оценка. Практику начнём, а точнее продолжим, с дискретного вариационного ряда
и знакомого условия: Пример 8
По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3. Как решать
задачу? Если нам даны первичные данные
(исходные необработанные значения), то их можно тупо просуммировать и разделить результат на объём выборки: Но во многих задачах требуется составить вариационный ряд (см. Пример 4
)
: Мода
. Мода дискретного вариационного ряда – это варианта
с максимальной частотой. В данном случае . Моду легко отыскать по таблице, и ещё легче на полигоне частот
– это абсцисса самой высокой точки: Если все или почти все варианты
различны (что характерно для интервального ряда
), то модальное значение определяется несколько другим способом, о котором во 2-й части урока. Медиана
. Медиана вариационного ряда*
– это значение, которая делит его на две равные части (по количеству вариант). Но теперь нам нужно найти среднюю, моду и медиану. Решение
: чтобы найти среднюю
по первичным данным, лучше всего просуммировать все варианты и разделить полученный результат на объём совокупности: Эти подсчёты, кстати, займут не так много времени и при использовании оффлайн калькулятора. Но если есть Эксель, то, конечно, забиваем в любую свободную ячейку
=СУММ(, выделяем мышкой все числа, закрываем скобку )
, ставим знак деления /
, вводим число 30 и жмём Enter
. Готово. Что касается моды, то её оценка по исходным данным, становится непригодна. Хоть мы и видим среди чисел одинаковые, но среди них запросто может найтись пять так шесть-семь вариант с одинаковой максимальной частотой, например, частотой 2. Кроме того, цены могут быть округлёнными. Поэтому модальное значение рассчитывается по сформированному интервальному ряду (о чём чуть позже)
. Чего не скажешь о медиане: забиваем в Эксель
=МЕДИАНА(, выделяем мышью все числа, закрываем скобку )
и жмём Enter
: . Причём, здесь даже ничего не нужно сортировать. Но в Примере 6
была проведена сортировка по возрастанию (вспоминаем и сортируем – ссылка выше)
, и это хорошая возможность повторить формальный алгоритм отыскания медианы. Делим объём выборки пополам: И поскольку она состоит из чётного количества вариант, то медиана равна среднему арифметическому 15-й и 16-й варианты упорядоченного
(!) вариационного ряда: ден. ед. Ситуация вторая
. Когда дан готовый интервальный ряд (типичная учебная задача). Продолжаем анализировать тот же пример с ботинками, где по исходным данным был составлен ИВР
. Для вычисления средней
потребуются середины интервалов: По сути дела, здесь мы приблизили интервальный ряд дискретным, и это приближение оказалось весьма эффективным. Впрочем, особой выгоды тут нет, т.к. при современном программном обеспечении не составляет труда вычислить точное значение даже по очень большому массиву первичных данных. Но это при условии, что они нам известны:) С другими центральными показателями всё занятнее. Чтобы найти моду, нужно найти модальный интервал
(с максимальной частотой)
– в данной задаче это интервал с частотой 11, и воспользоваться следующей страшненькой формулой: – нижняя граница модального интервала; Таким образом: Не вдаваясь в геометрию формулы, просто приведу гистограмму относительных частот
и отмечу : Справочно разберу редкие случаи: – если модальный интервал крайний, то либо ;
– если обнаружатся 2 модальных интервала, которые находятся рядом, например, и , то рассматриваем модальный интервал , при этом близлежащие интервалы (слева и справа) по возможности тоже укрупняем в 2 раза.
– если между модальными интервалами есть расстояние, то применяем формулу к каждому интервалу, получая тем самым 2 или бОльшее количество мод.
Вот такой вот депеш мод:) И медиана. Если дан готовый интервальный ряд, то медиана рассчитывается чуть по менее страшной формуле, но сначала нудно (описка по Фрейду:)) найти медианный интервал
– это интервал, содержащий варианту (либо 2 варианты), которая делит вариационный ряд на две равные части. Выше я рассказал, как определить медиану, ориентируясь на относительные накопленные частоты
, здесь же сподручнее рассчитать «обычные» накопленные частоты . Вычислительный алгоритм точно такой же – первое значение сносим слева (красная стрелка)
, и каждое следующее получается как сумма предыдущего с текущей частотой из левого столбца (зелёные обозначения в качестве примера)
: Поскольку у нас чётное количество вариант (30 штук), то медианным будет тот интервал, который содержит 30/2 = 15-ю и 16-ю варианту. И ориентируясь по накопленным частотам, легко прийти к выводу, что эти варианты содержатся в интервале . Формула медианы: Таким образом: Зарплат в различных отраслях экономики, температуру и уровень осадков на одной и той же территории за сопоставимые периоды времени, урожайность выращиваемых культур в разных географических регионах и т. д. Впрочем, средняя является отнюдь не единственным обобщающим показателем - в ряде случае для более точной оценки подходит такая величина как медиана. В статистике она широко применяется в качестве вспомогательной описательной характеристики распределения какого-либо признака в отдельно взятой совокупности. Давайте разберемся, чем она отличается от средней, а также чем вызвана необходимость ее использования. Медиана в статистике: определение и свойства
Представьте себе следующую ситуацию: на фирме вместе с директором работают 10 человек. Простые работники получают по 1000 грн., а их руководитель, который, к тому же, является собственником, - 10000 грн. Если вычислить среднее арифметическое, то получится, что в среднем зарплата на данном предприятии равна 1900 грн. Будет ли справедливым данное утверждение? Или возьмем такой пример, в одной и той же больничной палате находится девять человек с температурой 36,6 °С, и один человек, у которого она равна 41 °С. Арифметическое среднее в этом случае равно: (36,6*9+41)/10 = 37,04 °С. Но это вовсе не означает, что каждый из присутствующих болен. Все это наталкивает на мысль, что одной средней часто бывает недостаточно, и именно поэтому в дополнение к ней используется медиана. В статистике этим показателем называют вариант, который расположен ровно посередине упорядоченного вариационного ряда. Если посчитать ее для наших примеров, то получится соответственно 1000 грн. и 36,6 °С. Другими словами, медианой в статистике называется значение, которое делит ряд пополам таким образом, что по обе стороны от нее (вниз или вверх) расположено одинаковое число единиц данной совокупности. Из-за этого свойства данный показатель имеет еще несколько названий: 50-й перцентиль или квантиль 0,5. Как найти медиану в статистике
Способ расчета данной величины во многом зависит от того, какой тип вариационного ряда мы имеем: дискретный или интервальный. В первом случае, медиана в статистике находится довольно просто. Все, что нужно сделать, это найти сумму частот, разделить ее на 2 и затем прибавить к результату ½. Лучше всего будет пояснить принцип расчета на следующем примере. Предположим, у нас есть сгруппированные данные по рождаемости, и требуется выяснить, чему равна медиана. Номер группы семей по кол-ву детей Кол-во семей Проведя нехитрые подсчеты, получим, что искомый показатель равен: 195/2 + ½ = варианта. Для того чтобы выяснить, что это означает, следует последовательно накапливать частоты, начиная с наименьшей варианты. Итак, сумма первых двух строк дает нам 30. Ясно, что здесь 98 варианты нет. Но если прибавить к результату частоту третьей варианты (70), то получится сумма, равная 100. В ней как раз и находится 98-я варианта, а значит медианой будет семья, у которой есть двое детей. Что же касается интервального ряда, то здесь обычно используют следующую формулу: М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в которой: Опять же, без примера здесь разобраться довольно сложно. Предположим, есть данные по величине Зарплата, тыс. руб. Накопленные частоты Чтобы воспользоваться вышеприведенной формулой, вначале нам нужно определить медианный интервал. В качестве такого диапазона выбирают тот, накопленная частота которого превышает половину всей суммы частот или равна ей. Итак, разделив 510 на 2, получаем, что этому критерию соответствует интервал со значением зарплаты от 250000 руб. до 300000 руб. Теперь можно подставлять все данные в формулу: М е = Х Ме + i Ме * (∑f/2 - S Ме-1)/f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тыс. руб. Надеемся, наша статья оказалась полезной, и теперь вы имеете ясное представление о том, что такое медиана в статистике и как ее следует рассчитывать. Функция МЕДИАНА в Excel используется для анализа диапазона числовых значений и возвращает число, которое является серединой исследуемого множества (медианой). То есть, данная функция условно разделяет множество чисел на два подмножества, первое из которых содержит числа меньше медианы, а второе – больше. Медиана является одним из нескольких методов определения центральной тенденции исследуемого диапазона. При исследовании возрастных групп студентов использовались данные случайно выбранной группы учащихся в ВУЗе. Задача – определить срединный возраст студентов. Исходные данные: Формула для расчета: Описание аргумента: Полученный результат: То есть в группе есть студенты, возраст которых меньше 21 года и больше этого значения. Во время вечернего обхода в больнице каждому больному была замерена температура тела. Продемонстрировать целесообразность использования параметра медиана вместо среднего значения для исследования ряда полученных значений. Исходные данные: Формула для нахождения среднего значения: Формула для нахождения медианы: Как видно из показателя среднего значения, в среднем температура у пациентов выше нормы, однако это не соответствует действительности. Медиана показывает, что как минимум у половины пациентов наблюдается нормальная температура тела, не превышающая показатель 36,6. Внимание!
Еще одним методом определения центральной тенденции является мода (наиболее часто встречающееся значение в исследуемом диапазоне). Чтобы определить центральную тенденцию в Excel следует использовать функцию МОДА. Обратите внимание: в данном примере значения медианы и моды совпадают: То есть срединная величина, делящая одно множество на подмножества меньших и больших значений также является и наиболее часто встречающимся значением в множестве. Как видно, у большинства пациентов температура составляет 36,6. Пример 3.
В магазине работают 3 продавца. По результатам последних 10 дней необходимо определить работника, которому будет выдана премия. При выборе лучшего работника учитывается степень эффективности его работы, а не число проданных товаров. Исходная таблица данных: Для характеристики эффективности будем использовать сразу три показателя: среднее значение, медиана и мода. Определим их для каждого работника с использованием формул СРЗНАЧ, МЕДИАНА и МОДА соответственно: Для определения степени разброса данных используем величину, которая является суммарным значением модуля разницы среднего значения и моды, среднего значения и медианы соответственно. То есть коэффициент x=|av-med|+|av-mod|, где: Рассчитаем значение коэффициента x для первого продавца: Аналогично проведем расчеты для остальных продавцов. Полученные результаты: Определим продавца, которому будет выдана премия: Примечание: функция НАИМЕНЬШИЙ возвращает первое минимальное значение из рассматриваемого диапазона значений коэффициента x.
Коэффициент x является некоторой количественной характеристикой стабильности работы продавцов, которую ввел экономист магазина. С его помощью удалось определить диапазон с наименьшими отклонениями значений. Этот способ демонстрирует, как можно использовать сразу три метода определения центральной тенденции для получения наиболее достоверных результатов. Функция имеет следующий синтаксис: МЕДИАНА(число1;
[число2];...)
Описание аргументов: Примечания 1:
Примечания 2:
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 4
.
Расчёт структурных характеристик
вариационного ряда распределения.
Студент
должен:
знать:
-
область применения и методику расчёта структурных
средних величин;
уметь:
-
исчислять структурные средние величины;
-
формулировать вывод по полученным результатам.
Методические указания
В
статистике исчисляются мода и медиана, которые относятся к структурным средним,
так каких величина зависит от строения
статистической совокупности.
Расчёт моды
Модой
называется значение признака
(варианта), чаще всеговстречающееся
в изучаемой
совокупности. В дискретном ряду распределения модой будет варианта с наибольшей
частотой.
Например
: Распределение проданной женской обуви по размерам характеризуется
следующим образом:
Размер
обуви
Количество
проданных пар
В этом ряду
распределениямодой является 37 размер,
т.е. Мо=37 размер
.
Для
интервального ряда распределения мода определяется по формуле:
где Х
Mo
-
нижняя граница модального интервала;
h Mo
-
величина модального интервала;
f Mo
–
частота модального интервала;
f Mo
-1и
f Mo
+1
– частота интервала соответственно
предшествующего модальному
и следующего за ним.
Например
:
Распределение рабочих по стажу работы характеризуется следующими данными.
Стаж работы, лет
до 2
8-10
10 и более
Число рабочих, чел.
Определить моду
интервального ряда распределения.
Мода интервального ряда составляет
Мода всегда бывает
несколько неопределённой, т.к. она зависит от величины групп и точного
положения границ групп. Мода широко применяется в коммерческой практике при
изучении покупательского спроса, при регистрации цен и т.п.
Расчёт медианы
Медианой
в статистике называется варианта,
расположенная в середине упорядоченного ряда данных, и которая делит
статистическую совокупность на две равные части так, что у одной половины
значения меньше медианы, а у другой половины – больше её. Для определения
медианы необходимо построить ранжированный ряд, т.е. ряд в порядке возрастания
или убывания индивидуальных значений признака.
В дискретном
упорядоченном ряду с нечётным числом членов медианой будет варианта,
расположенная в центре ряда.
Например
: Стаж пяти рабочих составил 2, 4, 7, 9 и 10 лет. В таком ряду медиана-7
лет, т.е. Ме=7 лет
Если дискретный
упорядоченный ряд состоит из чётного числа членов, то медианой будет средняя
арифметическая из двух смежных вариант, стоящих в центре ряда.
Например
: Стаж работы шести рабочих составил 1, 3, 4, 5, 10 и 11лет. В этом ряду
имеются две варианты, стоящие в центре ряда. Это варианты 4 и 5. Средняя
арифметическая из этих значений и будет медианой ряда
Чтобы определить медиану для
сгруппированных данных, необходимо считать накопленные частоты.
Например:
По имеющимся данным определим медиану размера обуви
Размер обуви
Количество проданных пар
Сумма накопленных частот
8+19=27
27+34=61
61+108=169
Итого
Для
определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание
итога продолжается до получения накопленной суммычастот, превышающей половину суммы частот
ряда. В нашем примере сумма частот составила 300, её половина – 150. Накопленная
сумма частот получилась равной 169. Варианта, соответствующая этой сумме, т.е.
37 и есть медиана ряда.
Если
же сумма накопленных частот против одной из вариант равна точно половине суммы
частот ряда, то медиана определяется как средняя арифметическая этой варианты и
последующей.
Например
: По имеющимся данным определим медиану заработной платы рабочих
Месячная заработная плата, тыс.р
уб.
Число рабочих, чел.
Сумма накопленных частот
14,0
14,2
2+6=8
16,0
8+12=20
16,8
18,0
Итого:
Медиана будет равна: Медиана
интервального вариационного ряда распределения определяется по формуле:
ГдеХ Ме
– нижняя граница медианного интервала;
h Me
–
величина медианного интервала;
∑
f
- сумма частот ряда;
f
Ме
– частота медианного интервала;
Например:
По имеющимся данным о распределении предприятий по численности
промышленно – производственного персонала рассчитать медиану в интервальном
вариационном ряду
Число предприятий
Сумма накопленных частот
100-200
200-300
1+3=4
300-400
4+7=11
400-500
11+30=41
500-600
600-700
700-800
Итого:
Определим, прежде всего,
медианный интервал. В данном примере сумма накопленных частот, превышающих половину
суммы всех значений ряда, соответствует интервалу 400-500.Это и есть медианный
интервал, т.е. интервал, в котором находится медиана ряда. Определим её
значение
Если же сумма накопленных частот
против одного из интервалов равна точно половине суммы частот ряда, то медиана
определяется по формуле:
где
n
– число
единиц в совокупности.
Например:
По имеющимся данным о распределении предприятий по
численности промышленно – производственного персонала рассчитать медиану в
интервальном вариационном ряду
Группы предприятий по численности ППП, чел.
Число предприятий
Сумма накопленных частот
100-200
200-300
1+3=4
300-400
4+6=10
400-500
10+30=40
500-600
40+20=60
600-700
700-800
Итого:
чел
Моду и медиану в
интервальном ряду можно определить
графически:
моду
в дискретных рядах - по полигону распределения, моду в интервальных рядах - по
гистограмме распределения, а медиану - по кумуляте
.
Мода интервального ряда распределения
определяется по гистограмме распределения определяют
следующим образом. Для этого выбирается самый высокий прямоугольник, который
является в данном случае модальным. Затем правую вершину модального
прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А
левую вершину модального прямоугольника – с левым верхним углом последующего
прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось
абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения.
Медиана рассчитывается по
кумуляте
. Для её определения из точки на шкале
накопленных частот (частостей
), соответствующей 50%,
проводится прямая
, параллельная оси абсцисс, до
пересечения с кумулятой
. Затем из точки пересечения
указанной прямой с кумулятой
опускается перпендикуляр
на ось абсцисс. Абсцисса точки пересечения является медианой.
Кроме моды и медианы в вариантных рядах могут быть
определены и другие структурные характеристики – квантили. Квантили
предназначены для более глубокого изучения структуры ряда распределения.
Квантиль
– это значение
признака, занимающее определенное место в упорядоченной по данному признаку
совокупности. Различают следующие виды квантилей:
-
квартили
– значения признака, делящие упорядоченную
совокупность на
четыре
равные части;
-
децили
– значения признака, делящие упорядоченную совокупность на десять
равных частей;
-
перцентели
-
значения признака, делящие упорядоченную совокупность на сто равных частей.
Таким образом, для характеристики положения центра ряда распределения
можно использовать 3 показателя: среднее значение
признака
, мода, медиана
.
При выборе вида и формы конкретного показателя
центра распределения необходимо исходить из следующих рекомендаций:
-
для устойчивых социально-экономических
процессов в качестве показателя центра используют среднюю
арифметическую. Такие процессы характеризуются симметричными распределениями, в
которых ;
-
для неустойчивых процессов положение
центра распределения характеризуется с помощью Mo
или Me
. Для асимметричных процессов предпочтительной
характеристикой центра распределения является медиана, поскольку занимает
положение между средней арифметической и модой.
4. Мода. Медиана. Генеральная и выборочная средняя
, где
варианта
повторяется раз;
варианта – раз;
варианта – раз;
…
варианта – раз.
и при наличии одинаковых вариант формула запишется компактнее:
– как сумма произведений вариант на соответствующие частоты
.
– среднестатистический квалификационный разряд рабочих цеха.
– или же этот ряд предложен изначально (что бывает чаще). И тогда, мы, конечно, используем «цивилизованную» формулу:
Иногда таковых значений несколько (с одинаковой максимальной частотой), и тогда модой считают каждое из них.
ден. ед.
– чтобы воспользоваться знакомой формулой дискретного случая:
– отличный результат! Расхождение с более точным значением (), вычисленным по первичным данным, составляет всего 0,04.
, где:
– длина модального интервала;
– частота модального интервала;
– частота предыдущего интервала;
– частота следующего интервала.
ден. ед. – как видите, «модная» цена на ботинки заметно отличается от средней арифметической .
откуда хорошо видно, что мода смещена относительно центра модального интервала в сторону левого интервала с бОльшей частотой. Логично.
Всем понятен смысл чисел в правом столбце? – это количество вариант, которые успели «накопиться» на всех «пройденных» интервалах, включая текущий.
, где:
– объём статистической совокупности;
– нижняя граница медианного интервала;
– длина медианного интервала;
– частота
медианного интервала;
– накопленная частота
предыдущего
интервала.
ден. ед. – заметим, что медианное значение, наоборот, оказалось смещено правее, т.к. по правую руку находится значительное количество вариант:
И справочно особые случаи.
Примеры использования функции МЕДИАНА в Excel
Сравнение функций МЕДИАНА и СРЗНАЧ для вычисления среднего значения
Пример расчета медианы при статистическом анализе в Excel
Особенности использования функции МЕДИАНА в Excel