Интервальное оценивание параметров распределения проводится с помощью критических значений функций
В статистике имеются два подхода к оцениванию неизвестных параметров распределений: точечный и интервальный. В соответствии с точечным оцениванием, которое рассмотрено в предыдущем разделе, указывается лишь точка, около которой находится оцениваемый параметр. Желательно, однако, знать, как далеко может отстоять в действительности этот параметр от возможных реализаций оценок в разных сериях наблюдений.
Ответ на этот вопрос – тоже приближенный – дает другой способ оценивания параметров – интервальный. В соответствии с этим способом оценивания находят интервал, который с вероятностью, близкой к единице, накрывает неизвестное числовое значение параметра.
Понятие интервальной оценки
Точечная оценка является случайной величиной и для возможных реализаций выборки принимает значения лишь приближенно равные истинному значению параметра
. Чем меньше разность
, тем точнее оценка. Таким образом, положительное число
, для которого
, характеризует точность оценки и называется Ошибкой оценки (или предельной ошибкой).
Доверительной вероятностью (или надежностью) называется вероятность β, с которой осуществляется неравенство , т. е.
. (3.20)
Заменив неравенство равносильным ему двойным неравенством
, или
, получим
. (3.21)
Интервал , накрывающий с вероятностью β,
, неизвестный параметр
, называется Доверительным интервалом (или интервальной оценкой), соответствующим доверительной вероятности β.
Случайной величиной является не только оценка , но и ошибка
: ее значение зависит от вероятности β и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение (3.21) следует читать так: “Интервал
накроет параметр
с вероятностью β ”, а не так: “Параметр
попадет в интервал
с вероятностью β ”.
Смысл доверительного интервала состоит в том, что при многократном повторении выборки объема в относительной доле случаев, равной β, доверительный интервал, соответствующий доверительной вероятности β, накрывает истинное значение оцениваемого параметра. Таким образом, доверительная вероятность β характеризует Надежность доверительного оценивания: чем больше β, тем вероятнее, что реализация доверительного интервала содержит неизвестный параметр.
Следует, однако, иметь в виду, что с ростом доверительной вероятности β в среднем растет длина доверительного интервала, то есть уменьшается точность доверительного оценивания. Выбор доверительной вероятности определяется конкретными условиями; обычно используются значения β, равные 0,90; 0,95; 0,99.
Вероятность (3.22)
называется Уровнем значимости и характеризует относительное число ошибочных заключений в общем числе заключений.
В формуле (3.21) границы доверительного интервала симметричны относительно точечной оценки. Однако не всегда удается построить интервал, обладающий таким свойством. Более общим является следующее определение.
Интервальная оценка параметров распределения
Сущность задачи интервального оценивания параметров
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода «лучшей» оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т, получила название методов интервального оценивания. К их числу принадлежит метод Неймана.
Постановка задачи интервальной оценки параметров заключается в следующем:
Имеется: выборка наблюдений (x1, x2, …, xn) за случайной величиной Х. Объем выборки n фиксирован.
Необходимо с доверительной вероятностью g = 1– a определить интервал t0 – t1 (t0
Ограничения: выборка представительная, ее объем достаточен для оценки границ интервала.
На практике применяют два варианта задания доверительных границ:
— устанавливают из условия равенства вероятностей выхода за верхнюю и нижнюю границу Р(Т > q + Е1,g )=Р(Т
Общий метод построения доверительных интервалов
Метод позволяет по имеющейся случайной выборке построить функцию и(Т, q ), распределенную асимптотически нормально с нулевым математическим ожиданием и единичной дисперсией. В основе метода лежат следующие положения. Пусть:
f(х, q ) – плотность распределения случайной величины Х;
ln [L(x, q )] – логарифм функции правдоподобия;
;
А2 =М(у)2 – дисперсия у.
Доверительный интервал для математического ожидания
Пусть по выборке достаточно большого объема, n > 30, и при заданной доверительной вероятности 1– a необходимо определить доверительный интервал для математического ожидания m1, в качестве оценки которого используется среднее арифметическое .
Нормальный закон полностью определяется двумя параметрами – математическим ожиданием и дисперсией. Величина m 1 является несмещенной, состоятельной и эффективной оценкой математического ожидания, поэтому ее значение принимаем за значение математического ожидания. Определим оценку дисперсии случайного параметра m 1, учитывая, что этот параметр равен среднему арифметическому одинаково распределенных случайных величин xi (следовательно, их дисперсии D(xi) одинаковы и равны m 2)
.
Итак, случайная величина m 1 распределена по нормальному закону с параметрами m 1 и m 2 / n. Для установления необходимых соотношений целесообразно перейти к центрированным и нормированным величинам. Выражение m 1 – m1 можно трактовать как центрирование случайной величины m 1. Нормирование осуществляется делением на величину среднеквадратического отклонения оценки m 1
.
Для стандартизованной величины вероятность соблюдения неравенства определяется по функции нормального распределения
где . Значение b равно квантили u1– a /2 стандартного нормального распределения уровня 1– a /2. В частности, уровням надежности 0,9, 0,95 и 0,99 соответствуют значения допустимого отклонения u1– a /2 величины z, равные 1,64, 1,96 и 2,58 соответственно. Окончательно можно записать
Нетрудно заметить, что это выражение аналогично по своему содержанию формуле, полученной с использованием общего метода построения доверительного интервала.
n = m 2 u 2 1– a /2 /(e 2m 1 2 ).
Таким образом, чтобы снизить относительную погрешность на порядок, необходимо увеличить объем выборки на два порядка. Приведенная формула часто используется в статистическом моделировании для определения необходимого количества испытаний модели.
Во многих случаях предположение о нормальном распределении случайной величины m 1 становится приемлемым при n > 4 и вполне хорошо оправдывается при n >10. Оценка m 1 вполне пригодна для применения вместо m1. Но не так обстоит дело с дисперсией, правомочность ее замены на m2 не обоснована даже в указанных случаях. При небольшом объеме выборки, n (n–1) распределения Стьюдента с (n–1) степенями свободы.
Доверительный интервал для дисперсии
Если стандартизовать оценку дисперсии, то величина (n–1)s 2 /m2 имеет распределение хи-квадрат с (n–1) степенями свободы. Из этого вытекает вероятностное утверждение относительно выборочной дисперсии
Функция хи-квадрат несимметричная, поэтому границы интервала
c 2 1(n–1) и c 2 2(n–1) выбирают из условия равной вероятности выхода за их пределы P[(n–1)s 2 /m2 2 1(n–1)] = P[(n–1)s 2 /m2 >c 2 2(n–1)] = a /2 или
Значения границ соответствуют квантилям распределения хи-квадрат уровня a /2 и 1– a /2 с количеством степеней свободы n–1. Нижняя граница
c 2 1(n–1) равна квантили c 2a /2(n–1), а верхняя – квантили c 2 1–a /2(n–1). Если воспользоваться критическими точками распределения, то следует записать
c 2 1(n–1) = c 2 (1– a /2; n–1) и c 2 2(n–1) = c 2 (a /2; n–1).
Доверительный интервал для вероятности
Пусть случайная величина Х имеет только два возможных значения: 0 и 1. В результате проведения достаточно большого количества наблюдений эта случайная величина приняла единичное значение т раз. Необходимо при заданной надежности 1– a определить доверительный интервал для вероятности р, оценка которой соответствует частоте h = m/n.
где u 1– a /2 – квантиль стандартизованного нормального распределения.
Чтобы связать доверительный интервал с исходными параметрами n, h и u1– a /2, возведем выражение для Е в квадрат, т. е. преобразуем равенство к виду (h–p) 2 =u 2 1– a /2(1–p)p/n. Доверительные границы можно получить, решив это уравнение второй степени
С увеличением объема выборки (nh >200, nh(1–h)>200) такими слагаемыми как u 2 1– a /2, 0,5u 2 1– a /2 и 0,25u 2 1– a /2 можно пренебречь, тогда приближенно
Более общие результаты получены с учетом того, что случайная величина h распределена по биномиальному закону
,
Где – число сочетаний из n по k.
Исходя из этого положения, для практического применения получены значения нижней р1 и верхней р2 доверительных границ
;
,
Где – квантиль распределения хи-квадрат уровня x с числом степеней свободы k.
Эти формулы можно применять и в тех случаях, когда частость h события близка (равна) нулю или близка (равна) количеству экспериментов n соответственно. В первом случае НДГ р1 принимается равной нулю и рассчитывается только ВДГ р2. Во втором случае рассчитывается НДГ р1, а верхняя граница р2 =1.
26. Интервальные оценки параметров распределения.
Пусть найденная по данным выборки статистическая характеристика Q* служит оценкой неизвестного параметра Q. Будем считать Q постоянным числом (Q может быть и случайной величиной). Ясно, что Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q- Q*|. Другими словами, если d>0 и |Q- Q*|
УМХЮБКОБС ЧЕМЙЮЙОБ йФБЛ, ЧЕМЙЮЙОБ ЙНЕЕФ УФБОДБТФОПЕ ОПТНБМШОПЕ ТБУРТЕДЕМЕОЙЕ.
Окончание табл. 25.1
Пример 25.19. Для уточнения номинальной емкости т партии конденсаторов, произведенной на заводе, были измерены емкости п = 100 конденсаторов из этой партии и найдено выборочное среднее результатов измерений: х = 20,15 мкФ. Стабильность технологического процесса производства характеризуется средним квадратическим отклонением о емкости конденсаторов, найденным из статистических данных: о = 2 мкФ. Доверительные интервалы строим по формуле из первой строки табл. 25.1. Квантили ux_aj2 находим из приложения 1. В результате получаем интервалы: с использованием более точного второго дальномера проделали п2 =120 подобных измерений и подсчитали выборочную дисперсию S$y = —- м) 2 = 0,64 полученных результатов у Найти 95%-ный доверительный интервал для отношения показа- телеи точности —первого и второго дальномеров. ок ? По формуле из пятой строки табл. 25.1 получаем
|