Содержание:
Точечные оценки:
Пусть случайная величина имеет неизвестную характеристику а. Такой характеристикой может быть, например, закон распределения, математическое ожидание, дисперсия, параметр закона распределения, вероятность определенного значения случайной величины и т.д. Пронаблюдаем случайную величину n раз и получим выборку из ее возможных значений
Существует два подхода к решению этой задачи. Можно по результатам наблюдений вычислить приближенное значение характеристики, а можно указать целый интервал ее значений, согласующихся с опытными данными. В первом случае говорят о точечной оценке, во втором – об интервальной.
Определение. Функция результатов наблюдений
Для одной и той же характеристики можно предложить разные точечные оценки. Необходимо иметь критерии сравнения оценок, для суждения об их качестве. Оценка 



Определение. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемой величине: 
Определение. Оценка называется состоятельной, если при увеличении числа наблюдений она сходится по вероятности к оцениваемой величине, т.е. для любого сколь угодно малого
Если известно, что оценка 
Последнее условие удобно для проверки. В качестве меры разброса значений оценки 



Следует отметить, что несмещенность и состоятельность являются желательными свойствами оценок, но не всегда разумно требовать наличия этих свойств у оценки. Например, может оказаться предпочтительней оценка хотя и обладающая небольшим смещением, но имеющая значительно меньший разброс значений, нежели несмещенная оценка. Более того, есть характеристики, для которых нет одновременно несмещенных и состоятельных оценок.
Оценки для математического ожидания и дисперсии
Пусть случайная величина имеет неизвестные математическое ожидание и дисперсию, причем 


Несмещенность такой оценки следует из равенств
В силу независимости наблюдений
При условии 


Доказано, что для математического ожидания нормально распределенной случайной величины оценка 
Оценка математического ожидания посредством среднего арифметического наблюдаемых значений наводит на мысль предложить в качестве оценки для дисперсии величину
Преобразуем величину 

В силу (3.1.2) имеем 

Последняя запись означает, что оценка 

Величина
является несмещенной и состоятельной оценкой дисперсии.
Пример:
Оценить математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.
Решение. По формулам (3.1.1) и (3.1.3) имеем
Ответ.
Пример:
Данные 25 независимых наблюдений случайной величины представлены в сгруппированном виде:
Требуется оценить математическое ожидание и дисперсию этой случайной величины.
Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы (3.1.1) и (3.1.3) дают следующие оценки:
Ответ.
Метод наибольшего правдоподобия для оценки параметров распределений
В теории вероятностей и ее приложениях часто приходится иметь дело с законами распределения, которые определяются некоторыми параметрами. В качестве примера можно назвать нормальный закон распределения 




Пусть случайная величина Х имеет функцию распределения 

Продемонстрируем идею метода наибольшего правдоподобия на упрощенном примере. Пусть по результатам наблюдений, отмеченных на рис. 3.1.1 звездочками, нужно отдать предпочтение одной из двух функций плотности вероятности 

Из рисунка видно, что при значении параметра 



Этот принцип приводит к следующему способу действий. Пусть закон распределения случайной величины Х зависит от неизвестного значения параметра 





называют функцией правдоподобия. Величина 





Сформулированный принцип предлагает в качестве оценки значения параметра выбрать такое 



Во многих случаях, когда 
которое следует из необходимого условия экстремума. Поскольку 



Это уравнение называют уравнением правдоподобия. Им пользоваться удобнее, чем уравнением (3.1.5), так как функция 


Если параметров несколько (многомерный параметр), то следует взять частные производные от функции правдоподобия по всем параметрам, приравнять частные производные нулю и решить полученную систему уравнений.
Оценку, получаемую в результате поиска максимума функции правдоподобия, называют еще оценкой максимального правдоподобия.
Известно, что оценки максимального правдоподобия состоятельны. Кроме того, если для q существует эффективная оценка, то уравнение правдоподобия имеет единственное решение, совпадающее с этой оценкой. Оценка максимального правдоподобия может оказаться смещенной.
Метод моментов
Начальным моментом 


Центральным моментом 

Для оценки параметров распределения по методу моментов находят на основе опытных данных оценки моментов в количестве, равном числу оцениваемых параметров. Эти оценки приравнивают к соответствующим теоретическим моментам, величины которых выражены через параметры. Из полученной системы уравнений можно определить искомые оценки.
Например, если Х имеет плотность распределения 
Если воспользоваться величиной 


Пример:
Найти оценку параметра показательного закона распределения по методу моментов.
Решение. Плотность вероятности показательного закона распределения имеет вид 

Ответ.
Пример:
Пусть имеется простейший поток событий неизвестной интенсивности 




Решение. В простейшем потоке интервалы времени между последовательными моментами наступления событий потока имеют показательный закон распределения 

Тогда 

При таком значении 
Ответ.
Определение. Пусть 
В этой записи 
Величины 
Пример:
Случайная величина Х имеет равномерное распределение на отрезке 





Решение. Функция плотности вероятности величины Х имеет вид
В этом случае функция правдоподобия 





где 


откуда 
Оценкой наибольшего правдоподобия для параметра 
Ответ.
Пример:
Случайная величина X имеет функцию распределения
где 
Пусть 


Решение. Для построения функции правдоподобия найдем сначала функцию плотности вероятности
Тогда функция правдоподобия:
Логарифмическая функция правдоподобия:
Уравнение правдоподобия
не имеет решений. Критических точек нет. Наибольшее и наименьшее значения 

По виду функции 




Так как 

Ответ.
Пример:
Случайная величина Х имеет нормальный закон распределения 



Решение. В соответствии с (3.1.4) функция правдоподобия имеет вид
а логарифмическая функция правдоподобия:
Необходимые условия экстремума дают систему двух уравнений:
Решения этой системы имеют вид:
Отметим, что обе оценки являются состоятельными, причем оценка для 

Ответ.
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. 1) Число экспериментальных данных вычисляется по формуле:
Значит, объем выборки n = 50.
2) Вычислим среднее арифметическое значение эксперимента:
Значит, найдена оценка математического ожидания 
3) Вычислим исправленную выборочную дисперсию:
Значит, найдена оценка дисперсии: 
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. По формуле
перейдем к условным вариантам:
Для них произведем расчет точечных оценок параметров:
Следовательно, вычисляем искомые точечные оценки:
Ответ:
Пример:
По данным эксперимента построен интервальный статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
Решение. 1) От интервального ряда перейдем к статистическому ряду, заменив интервалы их серединами
2) Объем выборки вычислим по формуле:
3) Вычислим среднее арифметическое значений эксперимента:
3) Вычислим исправленную выборочную дисперсию:
Можно было воспользоваться следующей формулой:
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания M(X) нормально распределенной случайной величины X, если известно среднее квадратическое отклонение σ = 2, оценка математического ожидания 
Решение. Доверительный интервал для истинного математического ожидания с доверительной вероятностью 
где m = M(X) – истинное математическое ожидание; 𝑥̅ − оценка M(X) по выборке; n – объем выборки; 

Из табл. П 2.2 приложения 2 находим: 
Ответ: (9,216 ; 10,784).
Пример:
По данным эксперимента построен статистический ряд:
Найти доверительный интервал для математического ожидания M (X) с надежностью 0,95.
Решение. Воспользуемся формулой для доверительного интервала математического ожидания при неизвестной дисперсии:
где n – объем выборки; 𝑥̅ оценка M(X); s – оценка среднего квадратического отклонения; 

По числам 

Теперь вычисляем оценки для M(X) и D(X):
Следовательно, s ≈ 1,685. Поэтому искомый доверительный интервал математического ожидания задается формулой:
Ответ: (– 0,76; 0,76).
Пример:
По данным десяти независимых измерений найдена оценка квадратического отклонения 
Решение. Задача сводится к нахождению доверительного интервала для истинного квадратического отклонения, так как точность прибора характеризуется средним квадратическим отклонением случайных ошибок измерений.
Доверительный интервал для среднего квадратического отклонения находим по формуле:
где 


Находим:
Тогда можно записать:
Ответ: (0; 1,04).
- Доверительный интервал для вероятности события
- Проверка гипотезы о равенстве вероятностей
- Доверительный интервал для математического ожидания
- Доверительный интервал для дисперсии
- Системы случайных величин
- Вероятность и риск
- Определения вероятности событий
- Предельные теоремы теории вероятностей
Реферат
на тему «Точечные оценки»
по учебной дисциплине
«ОСНОВЫ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ»
Выполнил(а):
Савкина Юлия Камильевна
2022 г
Оглавление
Введение
Статистика есть наука о том, как,
не умея мыслить и понимать,
заставить делать это цифры.
В. О. Ключевский
Математическая статистика – это наука, изучающая методы сбора и обработки статистической информации для получения научных и практических выводов.
Одной из центральных задач математической статистики является задача оценивания теоретического распределения случайной величины на основе выборочных данных. При этом часто предполагается, что вид закона распределения генеральной совокупности известен, но неизвестны параметры этого распределения, такие как математическое ожидание, дисперсия и др. Требуется найти приближенные значения этих параметров, то есть получить статистические оценки указанных параметров.
Основным методом математической статистики является выборочный метод, его суть состоит в исследовании представительной выборочной совокупности – для достоверной характеристики совокупности генеральной. Данный метод экономит временные, трудовые и материальные затраты, поскольку исследование всей совокупности зачастую затруднено или невозможно.
Для нахождения вида функции оценивания того или иного параметра используют один из следующих методов: 1) метод максимального правдоподобия; 2) метод моментов; 3) оценивание с помощью метода наименьших квадратов
Числовые характеристики, полученные по выборкам, называют статистическими оценками параметров. Различают два вида оценок параметров точечные и интервальные.
В данной работе речь пойдет именно о точечных оценках.
Глава 1. Основная часть
Основные понятия математической статистики
Введем основные понятия, связанные с выборками. Генеральной совокупностью называется совокупность объектов, из которых производится выборка. Выборочной совокупностью (выборкой) называется совокупность случайно отобранных объектов из генеральной совокупности. Число объектов в совокупности называется ее объемом.
Числовые характеристики всей генеральной совокупности называются параметрами. Так как всю генеральную совокупность изучить достаточно часто не представляется возможным, о параметрах судят по выборочным характеристикам. На основании выборочных данных можно получить лишь приближенное значение параметра, которое является его оценкой.
Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется точечной оценкой, т.к представляет собой число или точку на числовой оси.
Числовые характеристики выборки
По результатам выборочных наблюдений вычисляются такие статистические выборочные характеристики, как выборочные средняя, дисперсия, среднее квадратичное отклонение, коэффициент корреляции и т.д. Эти характеристики определяют соответствующие параметры генеральной совокупности.
Пусть x1, x2, …, xn – выборка из генеральной совокупности объёма n.
Выборочной средней (или средним значение выборки) называется среднее арифметическое значение признака выборочной совокупности.
Генеральная средняя для изучаемого количественного признака Х по генеральной совокупности

Если все значения x1, x2, …, xn признака выборки объема n различны, то среднее значение выборки оценивается по формуле:

Для обозначения среднего значения выборки чаще всего используются обозначения 

Если значения признака Х1, X2, …, Хk в выборке имеют соответственно частоты n1, n2, …, nk, то последнюю формулу можно переписать в виде
Математическое ожидание характеризует среднее значение случайной величины и определяется по формулам:
|
|
(1.1) |
где mx обозначает число, полученное после вычислений по формуле (1.1); M[X] — оператор математического ожидания, ДСВ – дискретная случайная величина, НСВ – непрерывная случайная величина. Как видно из (1.1), в качестве математического ожидания используется «среднее взвешенное значение», причем каждое из значений случайной величины учитывается с «весом», пропорциональным вероятности этого значения.
Начальный момент k-го порядка случайной величины X есть математическое ожидание k-й степени этой случайной величины:
|
|
(1.2) |
При k=0 значение α0(x) = M[X0] = M [1] = 1; при k=1 — α1(x) = M[X1] = M [Х] = mx – математическое ожидание; при k=2 — α2(x) = M[X2].
Центрированной случайной величиной Х° называется случайная величина, математическое ожидание которой находится в начале координат (в центре числовой оси), т.е. M[X°] = 0. Операция центрирования (переход от нецентрированной величины Х к центрированной X°) имеет вид X° =X − mX .
Центральный момент порядка k случайной величины X есть математическое ожидание k-й степени центрированной случайной величины X:
|
|
(1.3) |
При k=0 значение 0(x)=M [X°0]=M [1]=1; при k=1 — 1(x)=M [X°1]=M [Х°] = 0; при k=2 — 2 (x)=M[X°2]= M [(X — mx)2]=M[X 2] — 2mx M [X ]+ mx2= α2 — mx2=Dx — дисперсия.
Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания и определяется по формулам:
|
|
(1.4) |
Дисперсия выборки или выборочная дисперсия оценивается по (слегка измененной) формуле:

Дисперсия случайной величины имеет размерность квадрата случайной величины, поэтому для анализа диапазона значений величины Х дисперсия не совсем удобна. Этого недостатка лишено среднее квадратическое отклонение (СКО), размерность которого совпадает с размерностью случайной величины. Выборочным средним квадратичным отклонением (стандартом) называют квадратный корень из выборочной дисперсии:
|
|
(1.5) |
Мода случайной величины равна ее наиболее вероятному значению, т.е. то значение, для которого вероятность pi (для дискретной случайной величины) или f(x) (для непрерывных случайной величины) достигает максимума: f (Mo) = max, p(X = Mo) = max.
Медиана случайной величины X равна такому ее значению, для которого выполняется условие p { X < Me } = p { X Me }. Медиана, как правило, существует только для непрерывных случайных величин. Значение Me может быть определено как решение одного из следующих уравнений:
|
|
(1.6) |
В точке Me площадь, ограниченная кривой распределения делится пополам.Медиана вычисляется следующим образом. Изучаемая выборка упорядочивается в порядке возрастания (N — объем выборки). Получаемая последовательность ak, где k=1,…, N называется вариационным рядом или порядковыми статистиками.
Если число наблюдений N нечетно, то медиана оценивается как m = aN+1/2
Если число наблюдений N четно, то медиана оценивается как m = ( aN/2 + aN/2+1 ) / 2
Квантиль хp случайной величины X — это такое ее значение, для которого выполняется условие
|
p { X < xp } = F(xp)= p. (1.7) |
(1.7) |
Очевидно, что медиана – это квантиль x0,5.
Свойства точечных оценок
Статистической оценкой Qˆ неизвестного параметра Q теоретического распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные. Точечной называется оценка, определяемая одним числом. Точечная оценка Qˆ параметра Q случайной величины X в общем случае равна
|
Qˆ= (x1, x2, …, xn), где xi – значения выборки. |
(1.8) |
Очевидно, что оценка Qˆ – это случайная величина, так как она является функцией от n-мерной случайной величины (Х1, …, Хn), где Хi, – значение величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом. Чтобы точечная оценка была наилучшей с точки зрения точности, необходимо, чтобы она была состоятельной, несмещенной и эффективной.
Оценка Qˆ называется состоятельной, если при увеличении объема выборки n она сходится по вероятности к значению параметра Q:
|
|
(1.9) |
Состоятельность – это минимальное требование к оценкам.
Оценка Qˆ называется несмещенной, если ее математическое ожидание точно равно параметру Q для любого объема выборки:
Несмещенная оценка Qˆ является эффективной, если ее дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра:
|
|
(1.11) |
Первые два требования к оценке являются обязательными, выполнение последнего требования – желательно.
Точечная оценка математического ожидания. На основании теоремы Чебышева в качестве состоятельной оценки математического ожидания может быть использовано среднее арифметическое значений выборки 
Определим числовые характеристики оценки 

Оценка (1.12) является эффективной, т.е. ее дисперсия минимальна, если величина X распределена по нормальному закону.
Состоятельная оценка начального момента k-го порядка определяется по формуле
Точечная оценка дисперсии. В качестве состоятельной оценки дисперсии может быть использовано среднее арифметическое квадратов отклонений значений выборки от выборочного среднего:
Определим математическое ожидание оценки S2. Так как дисперсия не зависит от того, где выбрать начало координат, выберем его в точке mX, т.е. перейдем к центрированным величинам:
Ковариация Kij =0, так как опыты, а, следовательно, и Хi − значение величины Х в i‑м опыте − независимы. Таким образом, величина является смещенной оценкой дисперсии, а несмещенная состоятельная оценка дисперсии равна:
Дисперсия величины S02 равна:
Для нормального закона распределения величины X формула (1.17) примет вид
Для равномерного закона распределения –
Состоятельная несмещенная оценка среднеквадратического отклонения определяется по формуле: (1.20)
Состоятельная оценка центрального момента k-го порядка равна:
Точечная оценка вероятности. На основании теоремы Бернулли несмещенная состоятельная и эффективная оценка вероятности случайного события A в схеме независимых опытов равна частоте этого события:
где m — число опытов, в которых произошло событие A; n — число проведенных опытов. Числовые характеристики оценки вероятности p*(A) = p* равны:
Среднее арифметическое х, выборочная дисперсия Дх, частость р – это точечные статистические оценки соответственно математического ожидания (генерального среднего) МХ, дисперсии (генеральной дисперсии) ДХ, истиной (генеральной) вероятности р. Чтобы не заблудиться в этом многообразии, удобно пользоваться таблицей 1, представленной ниже [3].
Методы построения точечных оценок
Выше мы рассматривали точечные оценки основных генеральных характеристик: математического ожидания, дисперсии, вероятности и др. Однако осталось неясным, каким образом получены эти оценки. В математической статистике разработано большое число методов оценивания неизвестных параметров по данным случайной выборки, из которых наиболее часто используются:
метод моментов1;
метод максимального правдоподобия2;
метод наименьших квадратов;
графический метод (или метод номограмм).
Рассмотрим первые два из них.
Метод моментов. Пусть имеется выборка {x1, …, xn} независимых значений случайной величины с известным законом распределения f(x, Q1 , …, Qm) и m неизвестными параметрами Q1, …, Qm. Необходимо вычислить оценки Qˆ1, …, Qˆm параметров Q1, …, Qm. Последовательность вычислений следующая:
Вычислить значения m начальных и/или центральных теоретических моментов
Определить m соответствующих выборочных начальных αkˆ(x) и/или центральных µkˆ(x) моментов по формулам (1.14, 1.21).
Составить и решить относительно неизвестных параметров Q1, …, Qm систему из m уравнений, в которых теоретические моменты приравниваются к выборочным моментам. Каждое уравнение имеет вид αk(x) =αkˆ(x) или µ k(x) = µ kˆ(x). Найденные корни являются оценками Q1ˆ, …, Qmˆ неизвестных параметров.
Замечание. Часть уравнений может содержать начальные моменты, а оставшаяся часть — центральные.
Метод максимального правдоподобия. Согласно данному методу оценки Qˆ1, …, Qˆm получаются из условия максимума по параметрам Q1, …, Qm положительной функции правдоподобия L ( x1, …, xn, Q1, …, Qm). Если случайная величина X непрерывна, а значения xi независимы, то функция правдоподобия равна
Если случайная величина X дискретна и принимает независимые значения xi с вероятностями p (X=xi) = pi ( xi, Q1, …, Qm), то функция правдоподобия равна
Система уравнений согласно этому методу может записываться в двух видах:
или
Найденные корни выбранной системы уравнений являются оценками Q1ˆ, …, Qmˆ неизвестных параметров Q1, …, Qm.
Как правило оценка максимального правдоподобия эффективнее оценки, полученной методом моментов, и более того, если существует несмещенная эффективная оценка параметра, то она будет получена методом максимального правдоподобия.
Глава 2. Практическая часть
Примеры вычисления точечных оценок
Пример 1. Найдем оценку для вероятности P наступления события A по данному числу m появления этого события в n испытаниях.
Решение. Воспользуемся методом максимального правдоподобия: в этом случае функция правдоподобия L равна L = Cnm P m (1—P) n—m.
Тогда ln (L) = ln Cnm + m ln (P) + (n—m) ln (1 — P).
Уравнение для определения оценки:
Значит, оценкой методом максимального правдоподобия вероятности наступления события будет его относительная частота w.
Пример 2. Случайная величина X (число появлений события А в t независимых испытаниях) подчинена биномиальному закону распределения с неизвестным параметром р. Ниже приведено эмпирическое распределение числа появлений события в 10 опытах по 5 испытаний в каждом (в первой строке указано число xi появлений события А в одном опыте; во второй строке указана частота ni — количество опытов, в которых наблюдалось столько появлений события А).
Найти методом моментов точечную оценку параметра р биномиального распределения. Оценить вероятность p0=P(X=0).
Решение. Математическое ожидание биномиального распределения известно: MX = m p. Приравняв математическое ожидание к выборочному среднему, получим уравнение: 

|
|
(05+12+21+31+41) / 10=1,1; |
||
|
|
= 1,1/5=0,22; |
|
Если распределение определяется двумя параметрами, то для построения их оценок два теоретических момента приравнивают двум соответствующим эмпирическим моментам тех же порядков (обычно первым двум).
Пример 3. Для изучения генеральной совокупности относительно некоторого количественного признака была извлечена выборка:
Найти несмещенные оценки генеральной средней и генеральной дисперсии.
Решение. Несмещенной оценкой генеральной средней является выборочная средняя:
Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия:

Пример 4. По выборке объема N=41 найдена смещенная оценка генеральной дисперсии DB=3. Найти несмещенную оценку дисперсии генеральной совокупности.
Решение. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия
Несмещенной оценкой генеральной дисперсии является «исправленная дисперсия»

Таким образом, мы получаем искомую несмещенную оценку дисперсии генеральной совокупности:
Пример 5. Для анализа лингвистических терминологических систем взято 7 фрагментов по 250 терминоупотреблений из русских лингвистических текстов. После подсчёта в каждом фрагменте числа употреблений слова «лицо» получен следующий вариационный ряд: 1,1,3,4,9,10,12.
1) Определите по выборке несмещённую и состоятельную оценку математического ожидания М(Х) и дисперсии D(X) случайной величины Х — «число употреблений слова «лицо» в русских лингвистических текстах.
2) Найдите несмещённую, состоятельную и эффективную оценку вероятности события А= «слово лицо использовано более 5 раз».
Решение
1) Несмещённая и состоятельная оценка М(Х) есть среднее выборочное.
Несмещённая и состоятельная оценка D(X) есть исправленная выборочная дисперсия: 
2) Несмещённой, состоятельной и эффективной оценкой вероятности события А= «слово лицо использовано более 5 раз» является частота этого события Р(А):
Пример 6. Выборка задана таблицей распределения
Найти выборочные характеристики: среднюю, дисперсию и среднее квадратическое отклонение.
Решение. Cначала находим 
Затем по формулам находим две другие искомые величины:
Пример 7. Из 1500 деталей отобрано 250, распределение которых по размеру Х задано в таблице:
|
xi |
7,8-8,0 |
8,0-8,2 |
8,2-8,4 |
8,4-8,6 |
8,6-8,8 |
8,8-9,0 |
|
ni |
5 |
20 |
80 |
95 |
40 |
10 |
Найти точечные оценки для среднего и дисперсии, а также дисперсию оценки среднего при повторном и бесповторном отборах.
Решение. Вычислим по формулам (используем середины интервалов сi, число интервалов r=6, объем выборки n=250):
|
сi |
7,9 |
8,1 |
8,3 |
8,5 |
8,7 |
8,9 |
|
|
ni |
5 |
20 |
80 |
95 |
40 |
10 |
n=250 |
Вычислим дисперсию оценки среднего:
для повторной выборки:
для бесповторной выборки
Пример 8. Выборочно обследовали партию кирпича. Из 100 проб в 12 случаях кирпич оказался бракованным. Найти оценку доли бракованного кирпича и дисперсию этой оценки.
Решение. По условию задачи, число бракованных изделий m=12, объем выборки n=100, тогда оценкой доли бракованных является выборочная доля
Дисперсия этой оценки для повторной выборки равна
А среднее квадратическое отклонение этой оценки равно
Задачи подобраны таким образом, чтобы показать их разнообразную тематику и способы решений. Это и доказательство свойств точечной оценки, представление выборок разными способами и вычисление точечных оценок. Чтобы облегчить свою работу, можно воспользоваться таблицей 1 (см Приложение 1).
Заключение
Точечная оценка параметра – это оценка, которая характеризуется одним конкретным числом (например, математическим ожиданием, дисперсией, средним квадратичным отклонением и т.д.). Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их основной недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности становится очень важным. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Решение задач математической статистики обусловливает существенный объем вычислений. Во избежание ошибок, можно воспользоваться инженерным калькулятором или выполнить вычисления с помощью офисного пакета MS Excel, в котором есть различные статистические функции и надстройки, в том числе и возможность решить задачи по теме «Анализ данных»
Список литературы
- Гмурман, В. Е. Теория вероятностей и математическая статистика: учебник для прикладного бакалавриата / В. Е. Гмурман. — 12-е изд. — Москва: Издательство Юрайт, 2019. — 479 с. — (Бакалавр. Прикладной курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431095.
- Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для бакалавриата и специалитета / В. Е. Гмурман. — 11-е изд., перераб. и доп. — Москва: Издательство Юрайт, 2019. — 406 с. — (Бакалавр и специалист). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431094.
- Малугин, В. А. Теория вероятностей и математическая статистика: учебник и практикум для вузов / В. А. Малугин. — Москва: Издательство Юрайт, 2022. — 470 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/teoriya-veroyatnostey-i-matematicheskaya-statistika-493318
- Малугин, В. А. Математическая статистика: учебное пособие для бакалавриата и магистратуры / В. А. Малугин. — Москва: Издательство Юрайт, 2019. — 218 с. — (Бакалавр и магистр. Академический курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/441413.
- Энатская, Н. Ю. Математическая статистика и случайные процессы: учебное пособие для вузов / Н. Ю. Энатская. — Москва: Издательство Юрайт, 2022. — 201 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/matematicheskaya-statistika-i-sluchaynye-processy-490096
Приложение 1
Таблица 1. Точечные оценки случайных величин
окончание таблицы 1
Таблица1. Точечные оценки случайных величин
1 Метод моментов был впервые предложен английским ученым, основателем математической статистики К. Пирсоном (1857-1936) в 1894 году.
2 Метод максимального правдоподобия разработал английский статистик Р. Фишер, который в 1921 г доказал, что ММ-оценки чаще всего не эффективны.
17 авг. 2022 г.
читать 2 мин
Точечная оценка представляет собой число, которое мы вычисляем на основе выборочных данных для оценки некоторого параметра совокупности. Это служит нашей наилучшей возможной оценкой того, каким может быть истинный параметр населения.
В следующей таблице показана точечная оценка, которую мы используем для оценки параметров совокупности:
| Измерение | Параметр населения | Балльная оценка | | — | — | — | | Иметь в виду | μ (среднее значение населения) | х (выборочное среднее) | | Доля | π (доля населения) | p (пропорция выборки) |
Хотя точечная оценка представляет собой наше лучшее предположение о параметре совокупности, не гарантируется, что она точно соответствует истинному параметру совокупности.
По этой причине мы также часто рассчитываем доверительные интервалы — интервалы, которые могут содержать параметр генеральной совокупности с определенным уровнем достоверности.
В следующих примерах показано, как рассчитать точечные оценки и доверительные интервалы в Excel.
Пример 1. Точечная оценка среднего значения генеральной совокупности
Предположим, нас интересует вычисление среднего веса популяции черепах. Для этого мы собираем случайную выборку из 20 черепах:
Наша точечная оценка среднего значения населения — это просто среднее значение выборки, которое оказывается равным 300,3 фунта:
Затем мы можем использовать следующую формулу для расчета 95% доверительного интервала для среднего значения генеральной совокупности:
Мы на 95% уверены, что истинный средний вес черепах в этой популяции находится в диапазоне [296,96, 303,64] .
Мы можем подтвердить эти результаты, используя калькулятор доверительного интервала .
Пример 2: Точечная оценка доли населения
Предположим, нам нужно рассчитать долю черепах в популяции, имеющих пятна на панцире. Для этого мы собираем случайную выборку из 20 черепах и обнаруживаем, что у 13 из них есть пятна.
Наша точечная оценка доли черепах с пятнами составляет 0,65 :
Затем мы можем использовать следующую формулу для расчета 95% доверительного интервала для доли населения:
Мы на 95% уверены, что истинная доля черепах в этой популяции с пятнами находится в диапазоне [0,44, 0,86] .
Мы можем подтвердить эти результаты, используя калькулятор доверительного интервала для пропорции .
Дополнительные ресурсы
Как рассчитать доверительные интервалы в Excel
Как рассчитать интервал прогнозирования в Excel
Как рассчитать погрешность в Excel
При
построении эконометрических моделей
часто используются так называемые
точечные
(или выборочные)
оценки различных коэффициентов модели.
Поэтому кратко остановимся на понятии
точечной оценки, ее свойствах и ее
вычислении в Excel.
Определение
точечной оценки.
Пусть над непрерывной случайной величиной
X
проведены
n
наблюдений, т.е. получены n
значений x1,
x2,…, xn,
которые составляют выборочную
совокупность
объемом n.
Обозначим через
некоторый неизвестный параметр закона
распределения величины X
(например, математическое ожидание). В
качестве статистической оценки
этого параметра примем некоторую функцию
от значений x1,
x2,…, xn,
т.е.
= φ(x1,
x2,…, xn). Нижний
индекс обозначает объем выборки. Такая
оценка, представленная одним числом,
называется
точечной.
Свойства
точечных оценок.
В отличие от параметра
оценка
является случайной величиной (как
функция случайных величин) и очевидно,
что
в общем случае не совпадает с
.
Для того чтобы
была «хорошей» оценкой для
необходимо, чтобы она была:
– несмещенной;
– эффективной;
– состоятельной.
Оценка
называется несмещенной,
если
,
т.е. среднее значение оценки
равно оцениваемому параметру. В противном
случае оценка называется смещенной.
Видно, что требование несмещенности
гарантирует отсутствие систематических
ошибок процедуры оценивания.
Возможные
значения несмещенной оценки
рассеяны вокруг. Оценка
называется эффективной,
если среди всех других несмещенных
оценок она имеет наименьшую дисперсию,
т.е. в меньшей степени отклонена от .
Оценка
называется состоятельной,
если при увеличении объема
выборки n
дисперсия оценки будет уменьшаться
(следовательно, точность оценки будет
увеличиваться).
Рассмотрим
часто используемые в эконометрике
точечные оценки числовых характеристик
случайной величины X.
Точечные
оценки для числовых характеристик
случайной величины.
Оценкой для математического ожидания
M(X)
случайной величины является выборочное
среднее
(1.6.1)
Можно
показать, что оценка
является несмещенной, эффективной и
состоятельной, т.е. удовлетворяет всем
требованиям «хорошей» оценки. В дальнейшем
операцию усреднения каких-либо значений
будем обозначать горизонтальной чертой
над обозначением этих значений. Например,
.
Оценкой
для дисперсии
= D(X)
случайной величины
является выборочная
дисперсия
(1.6.2)
На
практике для вычисления
часто используют следующую формулу:
.
(1.6.3)
Оценка
является состоятельной, но смещенной.
Несмещенная оценка имеет вид:
(1.6.4)
При
большом объеме выборки n
отличие между этими оценками пренебрежимо
мало.
Рассмотрим
точечную оценку mXY
для корреляционного момента μXY
и точечную оценку
для коэффициента корреляции
случайных величин X,
Y,
определяемых по выборке объемом n.
Оценки вычисляются по следующим формулам:
, (1.6.5)
где
Вычисление
точечных оценок в Excel.
Точечные
оценки можно вычислить двумя способами:
-
программируя
в ячейке соответствующее арифметическое
выражение; -
используя
соответствующие статистические функции
Excel.
Рассмотрим
на примерах эти два способа.
Пример 1.6.1.
На основе наблюдений получена выборка
объемом n = 12
значений случайной величины X,
приведенная на рис. 1.2 в ячейках В2,
В3,…, В13. Вычислить точечные оценки
для математического ожидания и дисперсии,
используя выражения (1.6.1), (1.6.2) и (1.6.4).
Решение.
Первоначально введем в таблицу исходные
данные следующим образом: в ячейки
A2:A13
занесем порядковые номера выборочных
значений, а в ячейки B2:B13
– сами выборочные значения (рис. 1.2).
По этим данным построим диаграмму,
называемую диаграммой рассеяния
(рис. 1.2). Далее, в ячейке В14 запрограммируем
формулу (1.6.1), а в ячейках С2:С13 вычислим
квадраты разностей
.
При этом обратите внимание на использование
абсолютного адреса $B$14
ячейки, где находится значение
.
Затем в ячейке С14 вычислим несмещенную
точечную оценку (1.6.4). Заметим, что
математическое ожидание случайной
величины (выборочные значения которой
занесены в столбе В) равно 0, а дисперсия
равна 1/12 = 0.0833. Видно отличие
значений точечных оценок от «точных»
значений числовых характеристик
случайной величины.
Для
вычисления точечных оценок для
математического ожидания и дисперсии
в Excel
определены следующие статистические
функции:
= СРЗНАЧ(диапазон
ячеек) –
реализует формулу (1.6.1);
= ДИСП(диапазон
ячеек) –
реализует формулу (1.6.4);
= ДИСПР(диапазон
ячеек) –
реализует формулу (1.6.2).
Пример
1.6.2. По
выборочным данным примера 1.6.1 вычислить
точечные оценки для математического
ожидания и дисперсии, используя
статистические функции Excel.
Решение.
В ячейке G13
запрограммируем функцию СРЗНАЧ, в ячейке
G14
функцию ДИСП, а в ячейке G15
функцию ДИСПР (см. рис. 1.2).
Для
вычисления выборочного
корреляционного момента
используется статистическая функция
Excel:
= КОВАР(диапазон
ячеек Х; диапазон ячеек У).
Для
вычисления выборочного
коэффициента корреляции
используются статистические функции
Excel:
= КОРРЕЛ(диапазон
ячеек Х; диапазон ячеек У);
= ПИРСОН(диапазон
ячеек Х; диапазон ячеек У),
Эти
функции дают один и тот же результат.

Рис.
1.2. Вычисление точечных оценок в Excel
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Содержание:
- Точечные статистические оценки параметров генеральной совокупности
- Методы определения точечных статистических оценок
- Законы распределения вероятностей для
- Интервальные статистические оценки для параметров генеральной совокупности
- Построение доверчивого интервала для при известном значении с заданной надежностью
- Построение доверительного интервала для при неизвестном значении из заданной надежности
- Построение доверительных интервалов с заданной надежностью для
- Построение доверительного интервала для генеральной совокупности с заданной надежностью
- Построение доверительного интервала для с помощью неравенства Чебишова с заданной надежностью
Информация, которую получили на основе обработки выборки про признак генеральной совокупности, всегда содержит определенные погрешности, поскольку выборка содержит только незначительную часть от нее 
Потому, следует организовать выборку так, чтобы эта информация была более полной (выборка может быть репрезентабельной) и обеспечивала с наибольшей степенью доверия о параметрах генеральной совокупности ил закон распределение ее признака.
Параметры генеральной совокупности 

Тут через 



Точечные статистические оценки параметров генеральной совокупности
Статистическая оценка 


то 

точечная статистическая оценка 
Разница
называется смещением статистической оценки
Оценочный параметр может иметь несколько точечных несмещенных статистических оценок, что можно изобразить так (рис. 116):
Например, пусть 




Из графиков плотности видим, что оценка 



Но на «хвостах» распределений имеет другую картину: большие отклонения от 





Точечная статистическая оценка называется эффективной, когда при заданном объеме выборки она имеет минимальную дисперсию. Следует, оценка 
Точечная статистическая оценка называется основой, если в случае неограниченного увеличения объема выборки 

Методы определения точечных статистических оценок
Существует три метода определения точечных статистических оценок для параметров генеральной совокупности.
Метод аналогий. Этот метод основывается на том, что для параметров генеральной совокупности выбирают такие же параметры выборки, то есть для оценки 
Метод наименьших квадратов. Согласно с этим методом статистические оценки обозначаются с условием минимизации суммы квадратов отклонений вариант выборки от статистической оценки 
Итак, используя метод наименьших квадратов, можно, например, обозначить статистическую оценку для 

Отсюда, для 

Метод максимальной правдоподобности. Этот метод занимает центральное место в теории статистической оценки параметров 
Пусть признак генеральной совокупности 



В этом варианте рассматриваются как независимые случайные величины, которые имеют один и тот же закон распределения, что ее признак генеральной совокупности 
Суть этого метода состоит в том, что фиксируя значение вариант 


Например, когда признак генеральной совокупности 
При этом статистические оценки 

На практике удобно от функции 
согласно с необходимым условием экстремума для этой функции получим:
Из первого уравнения системы 
из уравнение системы 
Следует, для 

Свойства 

И на самом деле,


Следует,
Проверим на несмещенность статистической оценки
Таким образом, получим
Следует, 


Когда 

Тогда
Следует, 

Отсюда точечной несмещенной статистической оценкой для 

Величину
называют исправленным средним квадратичным отклонением.
Исправленное среднее квадратичное отклонение, следует подчеркнуть, будет смещенной точечной статистической оценкой для 
где 

Пример. 200 однотипных деталей были отданы на шлифование. Результаты измерения приведены как дискретное статистическое распределение, подан в табличной форме:
Найти точечные смещенные статистические оценки для 
Решение. Поскольку точечной несмещенной оценки для 

Для обозначение точечной несмещенной статистической оценки для 
тогда точечная несмещенная статистическая оценка для 
Пример. Граничная нагрузка на стальной болт 
Обозначить точечные несмещенные статистические оценки для
Решение. Для обозначения точечных несмещенных статистических распределений к дискретному, который приобретает такой вид:
Вычислим
Следует, точечная несмещенная статистическая оценка для 
Для обозначения 
Отсюда точечная несмещенная статистическая оценка для 
Законы распределения вероятностей для 
Как уже обозначалось, числовые характеристики выборки являются случайными величинами, что имеют определенные законы распределения вероятностей. Так, 
следует, случайная величина 
Чтобы обозначить закон распределения для 


Пусть признак генеральной совокупности 





Рассмотрим случай, когда варианты выборки имеют частоты 

Перейдем от случайных величин 


Поскольку случайные величины 


Следует, случайные величины 
Построим матрицу 

Транспортируем матрицу 
Если перемножить матрицы 

где 
Следует, случайные величины 

Из курса алгебры известно, что во время ортогональных преобразований вектора сохраняется его длина, то есть
Тогда из формулы для 
Поскольку 
Следует, получим
Когда поделим левую и правую часть 

Поскольку 



То случайная величина
получим распределение 

Отсюда получается, что случайная величина 


Таким образом, приведена: случайная величина 

случайная величина
случайная величина
Интервальные статистические оценки для параметров генеральной совокупности
Точечные статистические оценки 


Статистическая оценка, что обозначается двумя числами, концами интервалов, называется интервальной.
Разница между статистической оценкой 

где 
Поскольку 


Вероятность, с которой берется неравенство 
называется надежностью
Равенство 
Интервал 


Построение доверчивого интервала для
при известном значении
с заданной надежностью
Пусть признак 








Случайная величина 
Потому 
Отсюда равенство 

или
Согласно с формулой нормированного нормального закона
для 
Из равенства 

Аргумент 

Следует, доверительный интервал равен:
что можно изобразить условно на рисунке 118.
Величина 
Пример. Измеряя 40 случайно отобранных после изготовления деталей, нашли выборку средней, что равна 15 см. Из надежности 
Решение. Для построенного доверчивого интервала необходимо найти:
Из условия задачи имеем: 



Найдем числовые значения концов доверчивого интервала:
Таким образом, получим:
Следует, с надежностью 

Пример. Имеем такие данные про размеры основных фондов (в млн руб.) на 30-ти случайно выбранных предприятий:
построить интервальное статистическое распределение с длиной шага 
С надежностью 


Решение. Интервальное статистическое распределение будет таким:
Для обозначение 
Тогда

Для построения доверительного интервала с заданной надежностью 
Вычислим концы интервала:


Следует, доверительный интервал для 
Пример. Какое значение может получит надежность оценки 


Решение. Обозначим погрешность выборки
Далее получим:
как видим, надежность мала.
Пример. Обозначить объем выборки 


Решение. По условию задачи 




Построение доверительного интервала для
при неизвестном значении
из заданной надежности 
Для малых выборок, с какими сталкиваемся, исследуя разные признаки в техники или сельском хозяйстве, для оценки 

что имеет распределение Стьюдента с 
Тогда 
поскольку 
Вычислив по данному статистическому распределению 


Тут 


Пример. Случайно выбранная партия из двадцати примеров была испытана относительно срока безотказной работы каждого из них 
С надежностью 

Решение. Для построения доверительного интеграла необходимо найти среднее выборочное и исправленное среднее квадратичное отклонение.
Вычислим
следует, получили 
Обозначим
следует,
Исправленное среднее квадратичное отклонение равно:

По таблице значений 


Вычислим концы доверительного интервала:


Следует, с надежностью 

При больших объемах выборки, а именно: 

Пример. В таблице приведены отклонения диаметров валиков, изготовленных на станке, от номинального размера:
с надежностью 
Решение. Для постройки доверительного интервала необходимо найти
Для этого от интегрального статистического распределения, приведенного в условии задачи, необходимо перейти к дискретному, а именно:
Вычислим

Следует,
Обозначим
Вычислим исправленное среднее квадратичное отклонение
Учитывая на большой 
Вычислим концы интервалов:
Итак, доверчивый интервал для среднего значения отклонений будет таким:
Отсюда с надежностью 
Построение доверительных интервалов с заданной надежностью
для 
В случае, если признак 


что имеет распределение 

Поскольку случайные действия

являются равновероятными, то есть их вероятности равны 
Подставляя в 

Следует, доверительный интервал для 
Тогда доверительный интервал для 

Значения 
где
Пример. Проверена партия однотипных телевизоров 

С надежностью 
Решение. Для построении доверительных интервалов необходимо найти значения
Вычислим значения

Вычислим
Следует
Исправленная дисперсия и исправленное среднее квадратичное отклонение равны:
Поскольку 


По таблице (дополнение 4) находим:
вычислим концы доверительного интервала для
Следует, доверительный интеграл для 
Доверительный интервал для 
Доверительный интервал для 

Поскольку
то равенство 
или
Обозначив 
чтобы найти 
что имеет распределение
Учитывая то, что события

при 
Если умножить все члены двойного неравенства 

Отсюда получим:
Из уравнения 


Доверительный интервал будет таким:
Пример. С надежностью 

Обозначим концы интервала:
Следует, доверительный интервал для 

Построение доверительного интервала для
генеральной совокупности с заданной надежностью 
Как величина, полученная по результатам выборки, 
Исправленное среднее квадратичное отклонение для
Для построения доверительного интервала для 
что имеет нормированный нормальный закон распределения 
Воспользовавшись 
Следует. доверительный интервал для 
где 
по таблице значений функции Лапласа.
Пример. Случайно выбранных студентов из потока университета были подвергнуты тестированию по математике и химии. Результаты этих тестирования преподнесено статистическим распределением, где 

Необходимо:
1) с надежностью 

2) с надежностью 
Решение. Вычислим основные числовые характеристики признак 



1. Построим доверительный интервал с надежностью 

нам известные значения 

где 
Обозначим концы интервала:
Следует, доверительный интервал для 
2. Построим доверительный интервал с надежностью 
Поскольку 
На известное значение 
Вычислим концы доверительного интервала:
Таким образом, доверительный интервал для 
Доверительный интеграл с надежностью 

Нам известно значение 

Обозначим концы доверительного интервала:
Следует, доверительный интервал для 
Доверительный интервал для 

Нам известны значения 

Обозначим концы доверительного интервала:
таким образом, доверительный интервал для 
Построение доверительного интервала для
с помощью неравенства Чебишова с заданной надежностью
В случае, если отсутствует информация про закон распределения признака генеральной совокупности 





Из 
Доверительный интервал дается таким неравенством:
Когда 

Пример. Полученные данные с 100 наугад выбранных предприятий относительно возрастания выработки на одного работника 
Воспользовавшись неравенством Чебишова, построить доверительный интервал для 

Решение. Для построения доверительного интервала с помощью неравенства Чебишова необходимо вычислить 

Тогда получим:
Воспользовавшись 
таким образом, доверительный интервал для 
или
Пример. Заданы размеры основных фондов 
Воспользовавшись неравенством Чебишова с надежностью 
Решение. Для постройки доверительного интервала для 

Следует, 

Обозначить концы доверительного интервала:


Итак, доверительный интервал для 
Лекции:
- Статистические гипотезы
- Корреляционный и регрессионный анализ
- Комбинаторика основные понятия и формулы с примерами
- Число перестановок
- Количество сочетаний
- Действия над событиями. Теоремы сложения и умножения вероятностей примеры с решением
- Примеры решения задач на тему: Случайные величины
- Примеры решения задач на тему: основные законы распределения
- Примеры решения задач на тему: совместный закон распределения двух случайных величин
- Статистические распределения выборок и их числовые характеристики



















































































































































































































при известном значении
с заданной надежностью




























при неизвестном значении
из заданной надежности 




























для 











































генеральной совокупности с заданной надежностью 






























с помощью неравенства Чебишова с заданной надежностью 

















