Загрузить PDF
Загрузить PDF
В статистике модой во множестве чисел называется число, которое встречается в этом множестве наиболее часто. Мод может быть несколько: если в наборе данных одинаково часто встречаются два или больше разных числа, его называют соответственно бимодальным или мультимодальным — иными словами, все значения, встречающиеся максимальное число раз, образуют моды данного множества. В данной статье описано, как найти моду (моды) множества.
-
1
Запишите числа множества. Моду обычно определяют на наборе статистических данных или множестве численных значений. Таким образом, для нахождения моды вам понадобится набор чисел. Моду сложно определить в уме, если чисел достаточно много, поэтому в большинстве случаев лучше записать все числа или набрать их на компьютере. Если у вас есть карандаш и бумага, достаточно записать все числа. Если же вы работаете за компьютером, удобнее использовать Excel.
- Метод определения моды легче понять на примере. Рассмотрим в данном разделе следующий набор чисел: {18, 21, 11, 21, 15, 19, 17, 21, 17}. В приведенных ниже шагах мы найдем моду этого множества.
-
2
Расположите числа в порядке возрастания. После того как вы выпишете все числа, полезно переписать их в порядке возрастания. Хотя можно обойтись и без этого, так найти моду будет проще, поскольку одинаковые числа расположатся рядом. Для больших наборов данных это просто необходимо, так как попытка просмотреть неупорядоченный список и подсчитать, сколько раз каждое число появляется в нем, довольно трудоемка и может привести к ошибкам.
- Если вы используете карандаш и бумагу, переписывание поможет вам сэкономить время в дальнейшем. Просмотрите числа, найдите наименьшее значение, вычеркните его из первоначального множества и занесите в новый список. Повторите то же самое для второго, затем для третьего наименьшего числа и так далее, при этом записывайте каждое число столько раз, сколько оно встречается в исходном наборе данных.
- Компьютер предоставляет больше возможностей — например, в большинстве программ для работы с электронными таблицами можно упорядочить список значений от наименьшего к наибольшему всего лишь несколькими щелчками мыши.
- В нашем примере после упорядочения получаем следующую последовательность чисел: {11, 15, 17, 17, 18, 19, 21, 21, 21}.
-
3
Подсчитайте, сколько раз повторяется каждое число. После того как вы перепишете значения в порядке возрастания, подсчитайте, сколько раз встречается каждое число. Поищите число, которое чаще всего попадается в списке. Если чисел сравнительно немного и они расположены в порядке возрастания, это довольно просто: найдите самую большую группу одинаковых значений и подсчитайте, сколько раз они повторяются.
- Если вы используете карандаш и бумагу, попробуйте записать над каждой группой одинаковых чисел, сколько раз они повторяются. Если вы пользуетесь компьютерной программой для работы с электронными таблицами, можно поступить подобным образом: запишите результаты подсчетов в соседние ячейки или используйте одну из опций для анализа данных.
- В нашем списке ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 11 и 15 встречаются по одному разу, 17 попадается дважды, 18 и 19 встречаются по одному разу, а 21 встречается три раза. Таким образом, в данном наборе значений чаще всего встречается число 21.
-
4
Определите значение (или значения), которые встречаются наиболее часто. После того как вы подсчитаете, сколько раз встречается каждое число, найдите значения, которые повторяются наибольшее количество раз. Это и есть мода данного множества. Помните, что набор чисел может иметь не одну, а несколько мод. Если в множестве наиболее часто встречаются два числа (то есть они повторяются одинаковое количество раз), такое множество называют бимодальным, если три числа — тримодальным и так далее.
- В нашем множестве ({11, 15, 17, 17, 18, 19, 21, 21, 21}) наиболее часто встречается значение 21, поэтому 21 является модой.
- Если бы кроме 21 нашлось еще одно число, которое также встречается три раза, (например, если бы множество включало еще одно число 17), то оно наряду с 21 было бы модой.
-
5
Не путайте моду множества чисел с его средним значением и медианой. При статистическом анализе часто рассматривают вместе такие понятия, как среднее значение, медиана и мода. Их легко спутать, так как они имеют схожие названия и иногда их значения совпадают. Однако независимо от того, совпадает или нет мода множества с его медианой или средним значением, следует помнить, что это три абсолютно разных понятия (смотрите ниже).
- Чтобы найти среднее значение множества, следует сложить все числа и поделить на их количество. Для нашего примера ({11, 15, 17, 17, 18, 19, 21, 21, 21}) среднее значение составляет 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78. Мы поделили сумму значений на 9, поскольку данное множество состоит из 9 чисел.
-
Медиана представляет собой «среднее число», которое разделяет меньшие и бо́льшие значения множества на две равные половины. Например, для нашего набора значений ({11, 15, 17, 17, 18, 19, 21, 21, 21}) медианой является число 18, так как слева и справа от него стоит по четыре числа. Учтите, что если множество содержит четное количество чисел, оно не имеет единственной медианы. В этом случае медианой обычно считают среднее значение тех двух чисел, которые расположены посередине.
Реклама
- Чтобы найти среднее значение множества, следует сложить все числа и поделить на их количество. Для нашего примера ({11, 15, 17, 17, 18, 19, 21, 21, 21}) среднее значение составляет 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78. Мы поделили сумму значений на 9, поскольку данное множество состоит из 9 чисел.
-
1
Множество не имеет моды, если каждое значение встречается в нем одинаковое число раз. Если все значения в данном наборе чисел попадаются одинаковое количество раз, то у этого множества нет моды, поскольку ни одно число не встречается чаще, чем любое другое. Например, моды не имеют те множества, в которые каждое число входит по одному разу. Это же касается тех множеств, в которых каждое число встречается дважды, трижды и так далее.
- Если мы изменим набор чисел в нашем примере на {11, 15, 17, 18, 19, 21}, так чтобы каждое значение встречалось лишь один раз, то он не будет иметь моды. То же верно и для множества, в котором все числа встречаются дважды, например {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
-
2
Помните, что моду нечислового набора данных можно определить точно так же, как для числовых множеств. Как правило, большинство наборов данных являются «количественными», то есть содержат данные в виде чисел. Тем не менее встречаются и такие множества, члены которых выражены не в виде чисел. В таких случаях можно сказать, что «мода» — это то значение, которое встречается чаще всего в наборе данных (как и для числовых множеств).[1]
При этом определить моду будет возможно, в то время как медиану или среднее значение — нельзя.- Предположим, при осмотре небольшого участка земли определили вид каждого растущего на нем дерева. Получился следующий список: {кедр, ольха, кедр, сосна, кедр, кедр, ольха, ольха, сосна, кедр}. Такой набор данных называют номинальным, поскольку входящие в него члены представляют собой названия. В этом случае модой является кедр, так как данное слово встречается чаще других (пять раз), в то время как ольха и сосна встречаются соответственно три и два раза.
- В рассмотренном выше примере невозможно найти среднее значение и медиану, так как набор данных содержит не числа, а названия.
-
3
При одномодальном симметричном распределении мода, среднее значение и медиана совпадают. Как отмечалось выше, в некоторых случаях мода, медиана и/или среднее значение могут совпадать. В частности, если плотность распределения того или иного набора данных образует идеально симметричную кривую с одной модой (например, гауссиану или колоколообразную кривую), мода, среднее значение и медиана равны друг другу. Плотность распределения отображает относительную частоту определенных значений, поэтому мода будет находиться точно посередине симметричной кривой распределения, так как эта самая высокая точка на графике соответствует наиболее распространенному значению. Поскольку набор данных симметричен, эта точка на графике будет соответствовать также медиане (центральной точке в наборе данных) и среднему значению.
- В качестве примера рассмотрим набор чисел {1, 2, 2, 3, 3, 3, 4, 4, 5}. Если мы отложим эти значения на графике, то получим симметричную кривую, которая достигает максимальной высоты 3 при x = 3 и опускается до 1 при x = 1 и x = 5. Значение 3 встречается чаще всего, поэтому оно является модой. Так как 3 расположено в центре и по обе стороны от него находится четыре числа, оно является также медианой. И наконец, среднее значение данного множества составляет 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3, то есть число 3 является также средним значением.
- Исключение из этого правила составляют симметричные множества с более чем одной модой — они имеют по одной медиане и среднему значению, с которыми не совпадают несколько мод.
Реклама
Советы
- Набор данных может иметь несколько мод.
- Если все числа встречаются лишь по одному разу, множество не имеет моды.
Реклама
Что вам понадобится
- Бумага, карандаш и ластик
Об этой статье
Эту страницу просматривали 47 353 раза.
Была ли эта статья полезной?

МИНОБРНАУКИ РОССИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ «ЛЭТИ» ИМ. В.И. УЛЬЯНОВА (ЛЕНИНА) Кафедра физической электроники и технологии
ОТЧЕТ по лабораторной работе №5
по дисциплине «Информационные технологии» Тема: Алгоритмы и программы решения задач комбинаторики
|
Студентка гр. 0207 |
Лиоско Е.П. |
Преподаватель
Санкт-Петербург
2021

Цель работы.
Изучение и программирование стандартного алгоритма «поиска моды».
Блок-схема программы для сортировки выбором.
Текст программы 1.
clc;
clear all; N=8;
mt=1;
mc=1;
im=1;
i=1;
s=[4 4 4 7 7 7 7 7];
%s=[4 4 4 4 4 7 7 7];
%s=[1 2 3 4 5 6 7 8];
while i<N-1 % рассмотрим весь массив
2
j=i;
while (j<N) && (s(j)==s(j+1)) % пока элемент повторяется,
а его номер в массиве меняется, и номер этого элемента <=8 mt=mt+1;
j=j+1;
end i=i+mt;
if mt>mc % сохраняем кол-во повторений (>1) в переменной
mc
mc=mt; im=i-mt;
end mt=1;
end
if mc>1 % если номер элемента > 1 disp(‘Значение моды :’); disp(s(im));
disp(‘Индекс начала последовательности значений моды:’); disp(im);
disp(‘Количество значений mc в последовательности моды:’); disp(mc);
else disp(‘No mode’); end
Таблица 1 листингов трех версий вектора S(8).
|
Листинг 1 |
Листинг 2 |
Листинг 3 |
||||
|
Значение моды : |
Значение моды : |
|||||
|
7 |
4 |
|||||
|
Индекс |
начала |
Индекс |
начала |
|||
|
последовательности |
последовательности |
|||||
|
значений моды: |
значений моды: |
No mode |
||||
|
4 |
1 |
|||||
|
Количество значений mc |
Количество значений mc |
|||||
|
в |
последовательности |
в |
последовательности |
|||
|
моды: |
моды: |
|||||
|
5 |
5 |
3
Текст программы 2.
clear all;
N=10^4; % N=10^5; N=10^6; N=10^7; mt=1;
mc=1;
im=1;
i=1;
s=fix(50*rand ([1 N])); tic;
y=quicksort(s);
while i<N-1 % рассмотрим весь массив j=i;
while (j<N) && (s(j)==s(j+1)) % пока элемент повторяется,
а его номер в массиве меняется, и номер этого элемента <=8 mt=mt+1;
j=j+1;
end i=i+mt;
if mt>mc % сохраняем кол-во повторений (>1) в переменной
mc
mc=mt; im=i-mt;
end mt=1;
end toc;
if mc>1 % если номер элемента > 1 disp(‘Значение моды :’); disp(s(im));
disp(‘Индекс начала последовательности значений моды:’); disp(im);
disp(‘Количество значений mc в последовательности моды:’); disp(mc);
else disp(‘No mode’); end
function[vector]=quicksort(vector)
if ~isempty(vector)% если вектор пустой, программа остановится
global cm; cm=cm+1; pivot=vector(1);
A1=quicksort(vector(vector<pivot));
A2=vector(vector==pivot);
A3=quicksort(vector(vector>pivot)); vector=[A1 A2 A3];
end end
4
Таблица 2.
|
i |
N |
t, сек |
|
1 |
104 |
0.017666 |
|
2 |
105 |
0.032427 |
|
3 |
106 |
0.128400 |
|
4 |
107 |
1.118960 |
Таблица 3.
|
i-j |
||
|
1-2 |
10 |
1,8 |
|
1-3 |
100 |
7,3 |
|
1-4 |
1000 |
63,3 |
KN=Nj/Ni, Kt=tj/ti
Вывод.
Временя поиска моды увеличивается с увеличением размерности вектора.
5
Соседние файлы в папке 2 сем
- #
- #
- #
- #
- #
- #
- #
- #
- #
|
1 / 1 / 0 Регистрация: 24.04.2011 Сообщений: 24 |
|
|
1 |
|
Найти моду в массиве10.07.2012, 12:08. Показов 27096. Ответов 17
Найти в массиве моду. *Массив размером m, m – натурал. число.
0 |
|
Programming Эксперт 94731 / 64177 / 26122 Регистрация: 12.04.2006 Сообщений: 116,782 |
10.07.2012, 12:08 |
|
17 |
|
155 / 155 / 44 Регистрация: 03.11.2010 Сообщений: 393 |
|
|
10.07.2012, 12:29 |
2 |
|
Код написан здесь
0 |
|
155 / 137 / 46 Регистрация: 15.02.2010 Сообщений: 750 |
|
|
10.07.2012, 12:31 |
3 |
|
Каковы максимальные значения m,n ???
0 |
|
155 / 155 / 44 Регистрация: 03.11.2010 Сообщений: 393 |
|
|
10.07.2012, 12:38 |
4 |
|
Каковы максимальные значения m,n ??? А откуда еще n взялось?
0 |
|
LVV 155 / 137 / 46 Регистрация: 15.02.2010 Сообщений: 750 |
||||
|
10.07.2012, 21:25 |
5 |
|||
|
В задаче не указан максимальный размер массива (m) и не указано, какие значения могут принимать элементы массива . Предположим, что речь идёт массиве натуральных чисел, максимальное из которых n<32768. запустите программу и посмотрите сколько времени занимает поиск моды в моём варианте, и в предложенной ссылке Мода массива для массива из 30000 элементов (я объединил оба кода)
P.S. Оба кода моду ищут правильно, только мой — для наименьшего числа массива, а предложенный по ссылке — первого из нескольких.
2 |
|
155 / 155 / 44 Регистрация: 03.11.2010 Сообщений: 393 |
|
|
11.07.2012, 15:44 |
6 |
|
В своем коде вы избавились от вложенного цикла за счет второго массива и получили лучшую скорость, это хорошо. За это плюсую.
0 |
|
Vinchi 0 / 0 / 0 Регистрация: 11.07.2012 Сообщений: 3 |
||||||||
|
27.08.2012, 19:09 |
7 |
|||||||
|
В задаче не указан максимальный размер массива (m) и не указано, какие значения могут принимать элементы массива . Предположим, что речь идёт массиве натуральных чисел, максимальное из которых n<32768. запустите программу и посмотрите сколько времени занимает поиск моды в моём варианте, и в предложенной ссылке Мода массива для массива из 30000 элементов (я объединил оба кода)
P.S. Оба кода моду ищут правильно, только мой — для наименьшего числа массива, а предложенный по ссылке — первого из нескольких. Спасибо!
0 |
|
agvk 0 / 0 / 0 Регистрация: 17.11.2014 Сообщений: 3 |
||||
|
08.11.2015, 19:26 |
8 |
|||
|
в универе написал, вроде как работает. код на Си
0 |
|
pproger 166 / 69 / 17 Регистрация: 22.03.2011 Сообщений: 196 |
||||
|
08.11.2015, 21:52 |
9 |
|||
|
Vetaliuy,
0 |
|
Pashtets 0 / 0 / 0 Регистрация: 30.12.2016 Сообщений: 77 |
||||||||
|
25.01.2017, 00:41 |
10 |
|||||||
|
/
} как этот код вообще может чтото искать если в самом начале rmax = 0; Добавлено через 26 минут
объясните плс как работает код целиком… и зачем нам нужен такой цикл с итерацией. Что делает итерация я чет не въеду.
0 |
|
LVV 155 / 137 / 46 Регистрация: 15.02.2010 Сообщений: 750 |
||||||||
|
25.01.2017, 14:10 |
11 |
|||||||
|
Мода — это значение, которое встречается наибольшее количество раз. Второй способ, заключается в использовании дополнительного целочисленного массива b[], и однократном прохождении исходного массива a[]. Этот способ удобен для целочисленного массива a[] с неотрицательными значениями элементов, поскольку эти значения будут использоваться в качестве индексов массива b[] Например, дан целочисленный массив a[1000], значения элементов которого не отрицательны и не превышают 10. Определим и обнулим новый массив b[11], максимальный индекс которого (10) равен максимально возможному значению элемента массива a[1000] int b[11] ={}; Но можно и для вещественного или строкового массива а[] найти моду за один проход, только для этого следует воспользоваться дополнительным ассоциативным массивом:
0 |
|
Peoples 1623 / 953 / 782 Регистрация: 06.02.2016 Сообщений: 2,449 Записей в блоге: 30 |
||||
|
25.01.2017, 15:21 |
12 |
|||
0 |
|
Pashtets 0 / 0 / 0 Регистрация: 30.12.2016 Сообщений: 77 |
||||
|
25.01.2017, 23:50 |
13 |
|||
|
LVV, я новичок, поэтому и решил эту задачу по своему…
В этом случае, такой алгоритм находит только 1 моду, ну я имею ввиду если в массиве будет 2 числа с одинаковым кол-вом повторений, то найдется только вариант число которого меньше. Но немного поковырять можно будет настроить, чтобы показывалось равенство двух или нескольких равных по количеству повторений цифр. Сравнить время работы программ точно не смог, пробовал выполнить функцией clock(); но погрешность была очень большая. Чет вчитываюсь в ваш вариант не все понимаю…
0 |
|
LVV 155 / 137 / 46 Регистрация: 15.02.2010 Сообщений: 750 |
||||||||||||
|
26.01.2017, 06:25 |
14 |
|||||||||||
|
Чет вчитываюсь в ваш вариант не все понимаю… Для целых неотрицательных чисел всё очень просто (читай описание выше):
Для вещественного массива ниже код с комментариями:
} А на Visual Studio код от Peoples пошел лишь после переделки строки инициализации вектора
0 |
|
badvik 3 / 3 / 0 Регистрация: 15.10.2015 Сообщений: 60 |
||||
|
26.02.2017, 16:59 |
15 |
|||
|
Если кому-то будет актуально или для замечаний, я дописал код, по быстрому алгоритму LVV и, чтобы выводил все варианты мод (мин. ручной ввод значений).
p.s. сравнивал с массивами вместо векторов, в пределах 1-1000 значений и размером до 100 000 разницы никакой не заметил.
0 |
|
DOLINSKYI 2 / 2 / 0 Регистрация: 16.08.2015 Сообщений: 31 |
||||
|
07.04.2017, 04:56 |
16 |
|||
|
Вот мой вариант. Буду рад если кому то пригодится!
1 |
|
3 / 2 / 3 Регистрация: 07.03.2018 Сообщений: 217 |
|
|
07.10.2018, 20:03 |
17 |
|
А как сделать так,чтобы программа выводила все одинаковые моды?Например у меня сгенерировался массив из 1000 элементов и в нем есть 3 одинаковые моды.Как реализовать их вывод?
0 |
|
3 / 3 / 0 Регистрация: 28.02.2018 Сообщений: 4 |
|
|
14.02.2020, 14:00 |
18 |
|
#include<iostream> if (schet[i]>=h) }
0 |
У вас эти циклы
int counter = 0;
for (int i = 0; i < numbers.size(); ++i)
{
for (int j = 0; j < numbers.size(); ++j)
{
if (numbers[i] == numbers[j])
++counter;
}
//сколько каждое число повторяется раз
arr.push_back(counter);
counter = 0;
}
не эффективны. Так как вектор был уже отсортирован, то не имеет смысла начинать внутренний цикл с позиции, равной 0.
Что касается вашего вопроса, то имеется несколько подходов. Например, вы могли записывать моды также в вектор. Второй подход состоит в двух проходах по отсортированному вектору. Сначала вы находите максимальное значение повторяющихся соседних элементов, а во втором проходе выводите те элементы, которые повторяются найденное число раз.
Ниже представлена программа, которая демонстрирует первый подход с использованием вектора для хранения мод.
#include <iostream>
#include <vector>
#include <algorithm>
int main()
{
std::vector<int> v = { 4, 8, 8, 4, 9 };
std::vector<int> mods;
std::sort( v.begin(), v.end() );
using size_type = std::vector<int>::size_type;
size_type max = 0;
for ( size_type i = 0, j; i < v.size(); i = j )
{
j = i + 1;
while ( v[j] == v[i] ) ++j;
if ( max <= j - i )
{
if ( max != 1 )
{
if ( max < j - i )
{
max = j - i;
mods.assign( 1, v[i] );
}
else
{
mods.push_back( v[i] );
}
}
}
}
if ( max == 1 )
{
std::cout << "We dont have moden";
}
else
{
std::cout << "Mode" << ( mods.size() == 1 ? ":" : "s:" );
for ( int x : mods ) std::cout << ' ' << x;
std::cout << 'n';
}
return 0;
}
Ее вывод на консоль следующий
Modes: 4 8
3.1.4. Как вычислить среднюю, моду и медиану интервального ряда?
Начнём опять с ситуации, когда нам даны первичные статические данные:
Пример 10
По результатам выборочного исследования цен на ботинки в магазинах города получены следующие данные (ден. ед.):
– это в точности числа из Примера 6. Но теперь нам нужно найти среднюю, моду и медиану.
Решение: чтобы найти среднюю по первичным данным, нужно
просуммировать все варианты и разделить полученный результат на объём совокупности:
ден. ед.
Эти подсчёты, кстати, займут не так много времени и при использовании оффлайн калькулятора. Но если есть Эксель, то,
конечно, забиваем в любую свободную ячейку:
=СУММ(, выделяем мышкой все числа, закрываем скобку ), ставим знак деления /, вводим число 30 и жмём Enter. Готово.
Что касается моды, то её оценка по исходным данным, становится непригодна. Хоть мы и видим среди чисел
одинаковые, но среди них запросто может найтись так 5-6-7 вариант с одинаковой максимальной частотой, например, частотой 2.
Поэтому модальное значение рассчитывается по сформированному интервальному ряду (см. ниже).
Чего не скажешь о медиане: забиваем в Эксель =МЕДИАНА(, выделяем мышью все числа, закрываем
скобку ) и жмём Enter: . Причём, здесь даже ничего
не нужно сортировать.
Но в Примере 6 я проводил сортировку совокупности по возрастанию (вспоминаем и сортируем), и это хорошая возможность
повторить формальный алгоритм отыскания медианы.
Делим объём выборки пополам:
, и поскольку она состоит из чётного
количества вариант, то медиана равна среднему арифметическому 15-й и 16-й варианты упорядоченного (!) вариационного
ряда:
ден. ед.
Ситуация вторая. Когда даны не первичные данные, а готовый интервальный ряд (что в учебных задачах бывает чаще).
Продолжаем анализировать этот же пример с ботинками, где по исходным данным был составлен ИВР. Для вычисления средней потребуются середины интервалов:
– чтобы воспользоваться знакомой формулой дискретного случая:
– и это отличный результат! Расхождение с
более точным значением (), вычисленным по
первичным данным, составило всего 0,04!
Здесь мы использовали упомянутый ранее приём – приблизили интервальный ряд дискретным, и это приближение оказалось
весьма эффективным. Впрочем, с современными программами не составляет особого труда вычислить точное значение даже по
очень большому массиву первичных данных. Если они нам известны 
С другими центральными показателями всё занятнее.
Чтобы найти моду, нужно найти модальный интервал (с максимальной частотой) – в нашей задаче
это интервал с частотой 11, и воспользоваться
следующей страшненькой формулой:
, где:
– нижняя граница модального интервала;
– длина модального интервала;
– частота модального интервала;
– частота предыдущего интервала;
– частота следующего интервала.
Таким образом:
ден. ед. – как видите, «модная» цена на
ботинки заметно отличается от среднего арифметического значения .
Не вдаваясь в геометрию формулы, просто приведу гистограмму относительных частот
и отмечу :
откуда хорошо видно, что мода смещена относительно центра модального интервала в сторону левого интервала
с бОльшей частотой. По той причине, что дешёвых ботинок больше. И, возможно, они тоже вполне себе модные.
Справочно остановлюсь на редких случаях:
– если модальный интервал крайний, то либо
;
– если обнаружатся два смежных модальных интервала, например, и
,
то рассматриваем модальный интервал , при этом
близлежащие интервалы (слева и справа) по возможности тоже укрупняем в два раза;
– если между модальными интервалами есть расстояние, то применяем формулу к каждому интервалу, получая тем самым две
или бОльшее количество мод.
Вот такой вот депеш мод 
И медиана. Она рассчитывается чуть по менее страшной формуле. Для её применения
нужно найти медианный интервал – это интервал, содержащий варианту (либо 2 варианты), которая делит вариационный ряд на две
равные части.
Выше я рассказал, как определить медиану, ориентируясь на относительные накопленные частоты
, здесь же сподручнее рассчитать
«обычные» накопленные частоты . Вычислительный
алгоритм такой же – первое значение сносим слева (красная стрелка), а каждое следующее получается как сумма
предыдущего с текущей частотой из левого столбца (зелёные обозначения в качестве примера):
Всем понятен смысл чисел в правом столбце? – это количество вариант, которые успели «накопится» на всех «пройденных»
интервалах, включая текущий.
Поскольку у нас чётное количество вариант (30 штук), то медианным будет тот интервал, который содержит -ю и 16-ю варианту. И ориентируясь по накопленным частотам, легко
прийти к выводу, что эти варианты содержатся в интервале .
Формула медианы:
, где:
– объём статистической совокупности;
– нижняя граница медианного
интервала;
– длина медианного интервала;
– частота медианного интервала;
– накопленная частота
предыдущего интервала.
Таким образом:
ден. ед. – заметим, что медианное
значение, в отличие от моды, оказалось смещено правее, т.к. по правую руку находится значительное количество вариант:
Справочно особые случаи:
– если медианным является крайний левый интервал, то ;
– если вариационный ряд содержит чётное количество вариант и две средние варианты попали в разные интервалы, то
объединяем эти интервалы, и по возможности удваиваем предыдущий интервал.
Ответ: ден. ед.
По сравнению с предыдущей задачей ,
центральные показатели оказались заметно отличны друг от друга. Это говорит об асимметрии
(«скошенности») распределения цен, что хорошо видно по гистограмме и совершенно логично –
ботинок низкого и среднего ценового сегмента много, а премиального – мало.
Задание для тренировки:
Пример 11
Для изучения затрат времени на изготовление одной детали рабочими завода проведена выборка, в результате которой получено
следующее статистическое распределение:
…да, тот самый завод Петровского 
Решаем эту задачу в Экселе – все числа и инструкции уже там. Если нет Экселя, считаем на
калькуляторе, что в данном случае может оказаться даже удобнее. Образец решения, как обычно, в конце книги. Это, кстати, уже
каноничная «интервальная» задача, в которой исследуется непрерывная величина – время.
Что ещё можно сказать по теме?
Несмотря на разнообразия рассмотренных показателей, их всё равно бывает не достаточно. Существуют крайне неоднородные
совокупности, у которых варианты «кучкуются» во многих местах, и по этой причине средняя, мода и
медиана плохо характеризуют положение дел.
В таких случаях вариационный ряд дробят с помощью квартилей, децилей, а в упоротых специализированных исследованиях – и с
помощью перцентилей.
Квартили упорядоченного вариационного ряда – это варианты , которые делят его на 4 равные (по количеству вариант) части. Из чего
автоматически следует, что 2-я квартиль – есть в точности медиана: .
В тяжёлых случаях проводится разбиение на 10 частей – децилями – это варианты, который делят упорядоченный вариационный ряд на 10 равных (по
количеству вариант) частей.
И в очень тяжелых случаях в ход пускается 99 перцентилей .
После разбиения вариационного ряда каждый участок исследуется по отдельности – рассчитываются локальные средние и другие
показатели.
В учебном курсе квартили, децили, перцентили встречаются редко, и посему я оставляю этот материал (их нахождение) для
самостоятельного изучения.
Ну а сейчас мы переходим к изучению второй группы статистических показателей:


| Оглавление |








