Оценка математического ожидания
Оценкой
математического ожидания является
среднее арифметическое значений:
.
В
случае, когда n
велико оценка
математического ожидания
вычисляется
по формуле:
,
где
хi
– значения
случайной величины, mi
– частоты
появления значений,
n
– общее количество проведенных
испытаний, k–
количество значений случайной величины.
Если частоты
mi
не учитывают,
то используют формулу:
,
где
хi
– значения
случайной величины,
n
– общее количество проведенных
испытаний.
Оценку
математического ожидания называют
также выборочной
средней.
Оценка дисперсии
Запишем формулу
дисперсии дискретной случайной
величины:
Так
как
,
а
,
то получим:
.
Полученная
величина называется дисперсией
выборки и обозначается
.
Однако, эта оценка
является смещенной
оценкой для дисперсии.
Несмещенной
оценкой дисперсии
считают величину:
.
Несмещенную
оценку дисперсии можно вычислять в
зависимости от представления
статистического ряда по формулам:
или
.
Оценка среднего квадратического отклонения
Несмещенная
оценка
среднего квадратического отклонения
.
Оценка
средней квадратической погрешности
среднего арифметического
Оценка
среднеквадратической погрешности
среднего арифметического вычисляется
по формуле:
.
При
решении задач на вычисление оценок
дисперсий расчеты удобно проводить в
таблице.
Интервальные оценки
Интервальной
оценкой называется множество точечных
оценок, которое зависит от результатов
наблюдений и, следовательно, является
случайным. Интервальной называется
оценку, которая определяется двумя
числами – концами интервала. Поэтому
каждой интервальной оценке ставится
в соответствие доверительная вероятность
или надежность, с которой эта оценка
накроет неизвестный параметр. В качестве
надежности берут число близкое к
единице.
Вероятность того,
что интервал (**
заключает в
себе (покрывает) неизвестный параметр
,
равна p:
Р**=p.
Доверительным
называется интервал (**,
который
покрывает неизвестный параметр с
заданной надежностью .
Наиболее часто p
равно 0,9;
0,95; 0,99; 0,999.
При исследованиях в фармации, медицине
и биологии доверительную вероятность
принимают равной 0,95.
Нахождение
доверительного интервала для оценки
нормального
распределения при
неизвестном .
Распределение Стьюдента
Пусть случайная
величина Х
имеет нормальное распределение, причем
и
неизвестны. По данным выборки можно
построить случайную величину Т
(ее возможные значения обозначим через
t):
,
где
–
выборочная средняя из n
наблюдений;
– оценка среднего квадратического
отклонения выборочной средней (оценка
среднеквадратической погрешности
среднего арифметического вычисляется
по формуле:
)
Распределение
Т с f=n-1 степенями свободы называется
t-распределением или распределением
Стьюдента. Функция плотности вероятности
зависит от числа степеней свободы f и
не зависит от дисперсии случайных
величин .
Пользуясь распределением Стьюдента
можно определить доверительный интервал,
покрывающий неизвестный параметр μ с
надежностью
.
Таким образом,
интервальной оценкой математического
ожидания является доверительный
интервал
.
Решение задач
1. Построить полигон
относительных частот, если дискретный
ряд распределения представлен в
таблице:
-
хi
37
38
39
40
41
42
43
mi
1
5
5
8
15
4
12
Решение.
Найдем объем выборки
.
Так как относительная частота
,
запишем в таблицу полученные значения:
-
хi
37
38
39
40
41
42
43
mi
1
5
5
8
15
4
12
p*
0,02
0,1
0,1
0,16
0,3
0,08
0,24
=1
Проконтролируем
результат, вычислив сумму полученного
ряда (по определению
).
Построим полигон относительных частот
(рис. 9.3).
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Содержание:
Точечные оценки:
Пусть случайная величина имеет неизвестную характеристику а. Такой характеристикой может быть, например, закон распределения, математическое ожидание, дисперсия, параметр закона распределения, вероятность определенного значения случайной величины и т.д. Пронаблюдаем случайную величину n раз и получим выборку из ее возможных значений
Существует два подхода к решению этой задачи. Можно по результатам наблюдений вычислить приближенное значение характеристики, а можно указать целый интервал ее значений, согласующихся с опытными данными. В первом случае говорят о точечной оценке, во втором – об интервальной.
Определение. Функция результатов наблюдений
Для одной и той же характеристики можно предложить разные точечные оценки. Необходимо иметь критерии сравнения оценок, для суждения об их качестве. Оценка 



Определение. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемой величине: 
Определение. Оценка называется состоятельной, если при увеличении числа наблюдений она сходится по вероятности к оцениваемой величине, т.е. для любого сколь угодно малого
Если известно, что оценка 
Последнее условие удобно для проверки. В качестве меры разброса значений оценки 



Следует отметить, что несмещенность и состоятельность являются желательными свойствами оценок, но не всегда разумно требовать наличия этих свойств у оценки. Например, может оказаться предпочтительней оценка хотя и обладающая небольшим смещением, но имеющая значительно меньший разброс значений, нежели несмещенная оценка. Более того, есть характеристики, для которых нет одновременно несмещенных и состоятельных оценок.
Оценки для математического ожидания и дисперсии
Пусть случайная величина имеет неизвестные математическое ожидание и дисперсию, причем 


Несмещенность такой оценки следует из равенств
В силу независимости наблюдений
При условии 


Доказано, что для математического ожидания нормально распределенной случайной величины оценка 
Оценка математического ожидания посредством среднего арифметического наблюдаемых значений наводит на мысль предложить в качестве оценки для дисперсии величину
Преобразуем величину 

В силу (3.1.2) имеем 

Последняя запись означает, что оценка 

Величина
является несмещенной и состоятельной оценкой дисперсии.
Пример:
Оценить математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.
Решение. По формулам (3.1.1) и (3.1.3) имеем
Ответ.
Пример:
Данные 25 независимых наблюдений случайной величины представлены в сгруппированном виде:
Требуется оценить математическое ожидание и дисперсию этой случайной величины.
Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы (3.1.1) и (3.1.3) дают следующие оценки:
Ответ.
Метод наибольшего правдоподобия для оценки параметров распределений
В теории вероятностей и ее приложениях часто приходится иметь дело с законами распределения, которые определяются некоторыми параметрами. В качестве примера можно назвать нормальный закон распределения 




Пусть случайная величина Х имеет функцию распределения 

Продемонстрируем идею метода наибольшего правдоподобия на упрощенном примере. Пусть по результатам наблюдений, отмеченных на рис. 3.1.1 звездочками, нужно отдать предпочтение одной из двух функций плотности вероятности 

Из рисунка видно, что при значении параметра 



Этот принцип приводит к следующему способу действий. Пусть закон распределения случайной величины Х зависит от неизвестного значения параметра 





называют функцией правдоподобия. Величина 





Сформулированный принцип предлагает в качестве оценки значения параметра выбрать такое 



Во многих случаях, когда 
которое следует из необходимого условия экстремума. Поскольку 



Это уравнение называют уравнением правдоподобия. Им пользоваться удобнее, чем уравнением (3.1.5), так как функция 


Если параметров несколько (многомерный параметр), то следует взять частные производные от функции правдоподобия по всем параметрам, приравнять частные производные нулю и решить полученную систему уравнений.
Оценку, получаемую в результате поиска максимума функции правдоподобия, называют еще оценкой максимального правдоподобия.
Известно, что оценки максимального правдоподобия состоятельны. Кроме того, если для q существует эффективная оценка, то уравнение правдоподобия имеет единственное решение, совпадающее с этой оценкой. Оценка максимального правдоподобия может оказаться смещенной.
Метод моментов
Начальным моментом 


Центральным моментом 

Для оценки параметров распределения по методу моментов находят на основе опытных данных оценки моментов в количестве, равном числу оцениваемых параметров. Эти оценки приравнивают к соответствующим теоретическим моментам, величины которых выражены через параметры. Из полученной системы уравнений можно определить искомые оценки.
Например, если Х имеет плотность распределения 
Если воспользоваться величиной 


Пример:
Найти оценку параметра показательного закона распределения по методу моментов.
Решение. Плотность вероятности показательного закона распределения имеет вид 

Ответ.
Пример:
Пусть имеется простейший поток событий неизвестной интенсивности 




Решение. В простейшем потоке интервалы времени между последовательными моментами наступления событий потока имеют показательный закон распределения 

Тогда 

При таком значении 
Ответ.
Определение. Пусть 
В этой записи 
Величины 
Пример:
Случайная величина Х имеет равномерное распределение на отрезке 





Решение. Функция плотности вероятности величины Х имеет вид
В этом случае функция правдоподобия 





где 


откуда 
Оценкой наибольшего правдоподобия для параметра 
Ответ.
Пример:
Случайная величина X имеет функцию распределения
где 
Пусть 


Решение. Для построения функции правдоподобия найдем сначала функцию плотности вероятности
Тогда функция правдоподобия:
Логарифмическая функция правдоподобия:
Уравнение правдоподобия
не имеет решений. Критических точек нет. Наибольшее и наименьшее значения 

По виду функции 




Так как 

Ответ.
Пример:
Случайная величина Х имеет нормальный закон распределения 



Решение. В соответствии с (3.1.4) функция правдоподобия имеет вид
а логарифмическая функция правдоподобия:
Необходимые условия экстремума дают систему двух уравнений:
Решения этой системы имеют вид:
Отметим, что обе оценки являются состоятельными, причем оценка для 

Ответ.
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. 1) Число экспериментальных данных вычисляется по формуле:
Значит, объем выборки n = 50.
2) Вычислим среднее арифметическое значение эксперимента:
Значит, найдена оценка математического ожидания 
3) Вычислим исправленную выборочную дисперсию:
Значит, найдена оценка дисперсии: 
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. По формуле
перейдем к условным вариантам:
Для них произведем расчет точечных оценок параметров:
Следовательно, вычисляем искомые точечные оценки:
Ответ:
Пример:
По данным эксперимента построен интервальный статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
Решение. 1) От интервального ряда перейдем к статистическому ряду, заменив интервалы их серединами
2) Объем выборки вычислим по формуле:
3) Вычислим среднее арифметическое значений эксперимента:
3) Вычислим исправленную выборочную дисперсию:
Можно было воспользоваться следующей формулой:
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания M(X) нормально распределенной случайной величины X, если известно среднее квадратическое отклонение σ = 2, оценка математического ожидания 
Решение. Доверительный интервал для истинного математического ожидания с доверительной вероятностью 
где m = M(X) – истинное математическое ожидание; 𝑥̅ − оценка M(X) по выборке; n – объем выборки; 

Из табл. П 2.2 приложения 2 находим: 
Ответ: (9,216 ; 10,784).
Пример:
По данным эксперимента построен статистический ряд:
Найти доверительный интервал для математического ожидания M (X) с надежностью 0,95.
Решение. Воспользуемся формулой для доверительного интервала математического ожидания при неизвестной дисперсии:
где n – объем выборки; 𝑥̅ оценка M(X); s – оценка среднего квадратического отклонения; 

По числам 

Теперь вычисляем оценки для M(X) и D(X):
Следовательно, s ≈ 1,685. Поэтому искомый доверительный интервал математического ожидания задается формулой:
Ответ: (– 0,76; 0,76).
Пример:
По данным десяти независимых измерений найдена оценка квадратического отклонения 
Решение. Задача сводится к нахождению доверительного интервала для истинного квадратического отклонения, так как точность прибора характеризуется средним квадратическим отклонением случайных ошибок измерений.
Доверительный интервал для среднего квадратического отклонения находим по формуле:
где 


Находим:
Тогда можно записать:
Ответ: (0; 1,04).
- Доверительный интервал для вероятности события
- Проверка гипотезы о равенстве вероятностей
- Доверительный интервал для математического ожидания
- Доверительный интервал для дисперсии
- Системы случайных величин
- Вероятность и риск
- Определения вероятности событий
- Предельные теоремы теории вероятностей
1. Оценки математического ожидания
1) Оптимальной оценкой математического ожидания является выборочное среднее
$tilde{m}=bar{X}$.
Оценка является несмещённой, состоятельной, эффективной.
2) На практике нередко возникает необходимость быстрой оценки математического ожидания. Такой оценкой
может быть
$tilde{m}=frac{{{X}_{min }}+{{X}_{max }}}{2}$.
Оценка является состоятельной и, по крайней мере, асимптотически несмещённой и асимптотически эффективной.
3) В качестве оценки математического ожидания симметричного распределения может быть
использована выборочная медиана
$tilde{m}=x_{0,5}^{*}$.
Можно показать, что при больших объёмах выборки распределение статистики $X_{0,5}^{*}$ аппроксимируется
нормальным распределением $Nleft( m,sigmasqrt{frac{pi }{2n}} right)$. Таким образом, эффективность
выборочной медианы как оценки математического ожидания равна
$e(X_{0,5}^{*})=frac{1/{{I}_{n}}(m)}{pi {{sigma }^{2}}/2n}=frac{{{sigma }^{2}}/n}{pi {{sigma }^{2}}/2n}=frac{2}{pi }approx 64 %$.
Оценка является состоятельной, несмещённой, но неэффективной.
4) Рассмотрим две выборки объёмов n1 и n2 из одной генеральной
совокупности. Пусть ${{bar{X}}_{1}}$ и ${{bar{X}}_{2}}$ – выборочные средние. Тогда
агрегированная оценка математического ожидания генеральной совокупности:
$tilde{m}=frac{{{n}_{1}}{{{bar{X}}}_{1}}+{{n}_{2}}{{{bar{X}}}_{2}}}{{{n}_{1}}+{{n}_{2}}}$
является несмещённой, состоятельной, эффективной.
2. Оценки дисперсии
1) Оптимальной оценкой дисперсии является исправленная выборочная дисперсия:
${{tilde{sigma }}^{2}}=frac{1}{n-1}sumlimits_{i=1}^{n}{{{({{X}_{i}}-bar{X})}^{2}}}$.
Оценка является несмещённой, состоятельной, эффективной.
2) Выборочная дисперсия
${{tilde{sigma }}^{2}}=frac{1}{n}sumlimits_{i=1}^{n}{{{({{X}_{i}}-bar{X})}^{2}}}$.
Оценка является асимптотически несмещённой, состоятельной, асимптотически эффективной.
3) На практике нередко возникает необходимость быстрой оценки дисперсии. Такой оценкой может быть
${{tilde{sigma }}^{2}}={{left( frac{{{X}_{max }}-{{X}_{min }}}{5} right)}^{2}}$.
Оценка является грубой, для большинства распределений смещённой и неэффективной.
4) В случае если известно математическое ожидание m генеральной совокупности, оптимальной
оценкой дисперсии является статистика:
${{tilde{sigma }}^{2}}=frac{1}{n}sumlimits_{i=1}^{n}{{{({{X}_{i}}-m)}^{2}}}$.
Оценка является несмещённой, состоятельной, эффективной.
5) Рассмотрим две выборки объёмов n1 и n2 из одной генеральной
совокупности. Пусть $S_{1}^{2}$ и $S_{2}^{2}$ – исправленные выборочные дисперсии. Тогда
агрегированная оценка дисперсии генеральной совокупности
${{tilde{sigma }}^{2}}=frac{({{n}_{1}}-1)S_{1}^{2}+({{n}_{2}}-1)S_{2}^{2}}{{{n}_{1}}+{{n}_{2}}-2}$
является несмещённой, состоятельной, эффективной.




























































































