Что такое доверительный интервал в метрологии
6.5. доверительная вероятность и доверительный интервал
6.5. доверительная вероятность и доверительный интервал
Рассмотренные точечные оценки параметров распределения дают оценку в виде числа, наиболее близкого к значению неизвестного параметра. Такие оценки используют только при большом числе измерений. Чем меньше объем выборки, тем легче допустить ошибку при выборе параметра. Для практики важно не только получить точечную оценку, но и определить интервал, называемый доверительным, между границами которого с заданной дове рителъной вероятностью
где q — уровень значимости; хн, хв— нижняя и верхняя границы интервала, находится истинное значение оцениваемого параметра.
В общем случае доверительные интервалы можно строить на основе неравенства Чебышева. При любом законе распределения случайной величины, обладающей моментами первых двух порядков, верхняя граница вероятности попадания отклонения случайной величины х от центра распределения Хц в интервал tSx описывается неравенством Чебышева
где Sx — оценка СКО распределения; t — положительное число.
Для нахождения доверительного интервала не требуется знать закон распределения результатов наблюдений, но нужно знать оценку СКО. Полученные с помощью неравенства Чебышева интервалы оказываются слишком широкими для практики. Так, доверительной вероятности 0,9 для многих законов распределений соответствует доверительный интервал 1,6SX. Неравенство Чебышева дает в данном случае 3,16SX. В связи с этим оно не получило широкого распространения.
В метрологической практике используют главным образом кван-тильные оценки доверительного интервала. Под 100P-процентным квантилем хр понимают абсциссу такой вертикальной линии, слева от которой площадь под кривой плотности распределения равна Р\%. Иначе говоря, квантиль — это значение случайной величины (погрешности) с заданной доверительной вероятностью Р. Например, медиана распределения является 50\%-ным квантилем х0,5.
На практике 25и 75\%-ный квантили принято называть сгибами, или квантилями распределения. Между ними заключено 50\% всех возможных значений случайной величины, а остальные 50\% лежат вне их. Интервал значений случайной величины х между х0 05 и х0 95 охватывает 90\% всех ее возможных значений и называется интерквантильным промежутком с 90\%-ной вероятностью. Его протяженность равна d0,9= х0,95 х0,05.
На основании такого подхода вводится понятие квантильных значений погрешности, т.е. значений погрешности с заданной доверительной вероятностью Р — границ интервала неопределенности ± DД = ± (хр х1-р)/2 = ± dp/2. На его протяженности встречается Р\% значений случайной величины (погрешности), a q = (1Р)\% общего их числа остаются за пределами этого интервала.
Для получения интервальной оценки нормально распределенной случайной величины необходимо:
• определить точечную оценку МО х̅ и СКО Sx случайной величины по формулам (6.8) и (6.11) соответственно;
• выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99;
• найти верхнюю хв и нижнюю хн границы в соответствии с уравнениями
полученными с учетом (6.1). Значения хн и хв определяются из таблиц значений интегральной функции распределения F(t) или функции Лапласа Ф(1).
Полученный доверительный интервал удовлетворяет условию
(6.13)
где n — число измеренных значений; zp — аргумент функции Лапласа Ф(1), отвечающей вероятности Р/2. В данном случае zp называется квантильным множителем. Половина длины доверительного интервала называется доверительной границей погрешности результата измерений.
Пример 6.1. Произведено 50 измерений постоянного сопротивления. Определить доверительный интервал для МО значения постоянного сопротивления, если закон распределения нормальный с параметрами mx = R = 590 Ом, Sx= 90 Ом при доверительной вероятности Р = 0,9.
Так как гипотеза о нормальности закона распределения не противоречит опытным данным, доверительный интервал определяется по формуле
Отсюда Ф(zр) = 0,45. Из таблицы, приведенной в приложении 1, находим, что zp= 1,65. Следовательно, доверительный интервал запишется в виде
или 590 21 Предмет: Физика Автор: Сергеев Алексей Георгиевич Год издания: 2001 Язык учебника: русский Рейтинг:
Просмотров: 9412
Доверительные интервалы
Приведенные выше оценки параметров распределения случайных величин в виде среднего арифметического для оценки математического ожидания и СКО для оценки дисперсии называются точечными оценками, так как они выражаются одним числом. Однако в некоторых случаях знание точечной оценки является недостаточным. Наиболее корректной и наглядной оценкой случайной погрешности измерений является оценка с помощью доверительных интервалов.
Симметричный интервал в границами ± Δх(Р) называется доверительным интервалом случайной погрешности с довери-тельной вероятностью Р, если площадь кривой распределения между абсциссами –Δх и +Δх составляет Р-ю часть всей площади под кривой плотности распределения вероятностей. При нормировке всей площади на единицу Р представляет часть этой площади в долях единицы (или в процентах). Другими словами, в интервале от -Dх(Р) до +Dх(Р) с заданной вероятностью Р встречаются Р×100% всех возможных значений случайной погрешности.
Доверительный интервал для нормального распределения находится по формуле:
где коэффициент t зависит от доверительной вероятности Р.
Для нормального распределения существуют следующие соотношения между доверительными интервалами и доверительной вероятностью: 1s (Р=0,68), 2s (Р= 0,95), 3s (Р= 0,997), 4s (Р=0,999).
Доверительные вероятности для выражения результатов измерений и погрешностей в различных областях науки и техники принимаются равными. Так, в технических измерениях принята доверительная вероятность 0,95. Лишь для особо точных и ответственных измерений принимают более высокие доверительные вероятности. В метрологии используют, как правило, доверитель-ные вероятности 0,97, в исключительных случаях 0,99. Необходимо отметить, что точность измерений должна соответствовать поставленной измерительной задаче. Излишняя точность ведет к неоправданному расходу средств. Недостаточная точность измерений может привести к принятию по его результатам ошибочных решений с самыми непредсказуемыми последствиями, вплоть до серьезных материальных потерь или катастроф.
При проведении многократных измерений величины х, подчиняющейся нормальному распределению, доверительный интервал может быть построен для любой доверительной вероятности по формуле:
где tq – коэффициент Стьюдента, зависящий от числа наблюдений n и выбранной доверительной вероятности Р. Он определяется с помощью таблицы q-процентных точек распределения Стьюдента, которая имеет два параметра: k = n – 1 и q = 1 – P; – оценка среднего квадратического отклонения среднего арифметического.
Доверительный интервал для погрешности Dх(Р) позволяет построить доверительный интервал для истинного (действи-тельного) значения измеряемой величины , оценкой которой является среднее арифметическое . Истинное значение измеряе-мой величины находится с доверительной вероятностью Р внутри интервала:
. Доверительный интервал позволяет выяснить, насколько может измениться полученная в результате данной серии измерений оценка измеряемой величины при проведении повторной серии измерений в тех же условиях. Необходимо отметить, что доверительные интервалы строят для неслучайных величин, значения которых неизвестны. Такими являются истинное значение измеряемой величины и средние квадратические отклонения. В то же время оценки этих величин, получаемые в результате обработки данных наблюдений, являются случайными величинами.
Недостатком доверительных интервалов при оценке случай-ных погрешностей является то, что при произвольно выбираемых доверительных вероятностях нельзя суммировать несколько погреш-ностей, т.к. доверительный интервал суммы не равен сумме довери-тельных интервалов. Суммируются дисперсии независимых случай-ных величин: Då = åDi. То есть, для возможности суммирования составляющие случайной погрешности должны быть представлены своими СКО, а не предельными или доверительными погрешностя-ми.
Доверительный интервал и доверительная вероятность
Для подавляющего большинства простых измерений достаточно хорошо выполняется так называемый нормальный закон случайных погрешностей (закон Гаусса), выведенный из следующих эмпирических положений.
1) погрешности измерений могут принимать непрерывный ряд значений;
2) при большом числе измерений погрешности одинаковой величины, но разного знака встречаются одинаково часто,
3) чем больше величина случайной погрешности, тем меньше вероятность ее появления.
, (2)
где — функция распределения случайных ошибок (погрешностей), характеризующая вероятность появления ошибки
, σ – средняя квадратичная ошибка.
Величина σ не является случайной величиной и характеризует процесс измерений. Если условия измерений не изменяются, то σ остается постоянной величиной. Квадрат этой величины называют дисперсией измерений. Чем меньше дисперсия, тем меньше разброс отдельных значений и тем выше точность измерений.
Точное значение средней квадратичной ошибки σ, как и истинное значение измеряемой величины, неизвестно. Существует так называемая статистическая оценка этого параметра, в соответствии с которой средняя квадратичная ошибка равняется средней квадратичной ошибке среднего арифметического . Величина которой определяется по формуле
, (3)
где — результат i-го измерения;
— среднее арифметическое полученных значений; n – число измерений.
Чем больше число измерений, тем меньше и тем больше оно приближается к σ. Если истинное значение измеряемой величины μ, ее среднее арифметическое значение, полученное в результате измерений
, а случайная абсолютная погрешность
, то результат измерений запишется в виде
.
Интервал значений от до
, в который попадает истинное значение измеряемой величины μ, называется доверительным интервалом. Поскольку
является случайной величиной, то истинное значение попадает в доверительный интервал с вероятностью α, которая называется доверительной вероятностью, или надежностью измерений. Эта величина численно равна площади заштрихованной криволинейной трапеции. (см. рис.)
Все это справедливо для достаточно большого числа измерений, когда близка к σ. Для отыскания доверительного интервала и доверительной вероятности при небольшом числе измерений, с которым мы имеем дело в ходе выполнения лабораторных работ, используется распределение вероятностей Стьюдента. Это распределение вероятностей случайной величины
, называемой коэффициентом Стьюдента, дает значение доверительного интервала
в долях средней квадратичной ошибки среднего арифметического
.
. (4)
Функция распределения табулирована (табл.1). Значение коэффициента Стьюдента находится на пересечении строки, соответствующей числу измерений n, и столбца, соответствующего доверительной вероятности α
Таблица 1.
n | α | n | α | ||||
0,8 | 0,9 | 0,95 | 0,98 | 0,8 | 0,9 | 0,95 | 0,98 |
1,9 | 2,9 | 4,3 | 7,0 | 1,5 | 2,0 | 2,6 | 3,4 |
1,6 | 2,4 | 3,2 | 4,5 | 1,4 | 1,9 | 2,4 | 3,1 |
1,5 | 2,1 | 2,8 | 3,7 | 1,4 | 1,9 | 2,4 | 3,9 |
Пользуясь данными таблицы, можно:
1) определить доверительный интервал, задаваясь определенной вероятностью;
2) выбрать доверительный интервал и определить доверительную вероятность.
При косвенных измерениях среднюю квадратичную ошибку среднего арифметического значения функции вычисляют по формуле
. (5)
Доверительный интервал и доверительная вероятность определяются так же, как и в случае прямых измерений.
Доверительная вероятность и доверительный интервал.
Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности,а сам интервал — доверительным интервалом.
.
на так называемый коэффициент Стьюдента. Коэффициенты Стьюдента для ряда значений
и n приведены в таблице.
Число измерений n | Доверительная вероятность y | ||
0,67 | 0,90 | 0,95 | 0,99 |
2,0 | 6,3 | 12,7 | 63,7 |
1,3 | 2,4 | 3,2 | 5,8 |
1,2 | 2,1 | 2,8 | 4,6 |
1,2 | 2,0 | 2,6 | 4,0 |
1,1 | 1,8 | 2,3 | 3,3 |
1,0 | 1,7 | 2,0 | 2,6 |
Окончательно, для измеряемой величины y при заданной доверительной вероятности y и числе измерений n получается условие
Величину мы будем называть случайной погрешностьювеличины y.
Пример: см. лекцию №5 – ряд чисел.
При числе измерений – 45 и доверительной вероятности – 0,95 получим, что коэффициент Стьюдента приблизительно равен 2,15. Тогда доверительный интервал для данного ряда измерений равен 62,6.
Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные оператором:
— неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы;
— неправильная запись результата наблюдений, значений отдельных мер использованного набора, например, гирь;
— хаотические изменения параметров напряжения, питающего средства измерения, например, его амплитуды или частоты.
Что такое доверительный интервал в метрологии
ГОСТ Р 50779.22- 2005
(ИСО 2602:1980)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
СТАТИСТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Точечная оценка и доверительный интервал для среднего
Дата введения 2005-07-01
Задачи, основные принципы и правила проведения работ по государственной стандартизации в Российской Федерации установлены ГОСТ Р 1.0-92 «Государственная система стандартизации Российской Федерации. Основные положения» и ГОСТ Р 1.2-92 «Государственная система стандартизации Российской Федерации. Порядок разработки государственных стандартов»
Сведения о стандарте
1 ПОДГОТОВЛЕН Техническим комитетом по стандартизации ТК 125 «Статистические методы в управлении качеством продукции» и Научно-исследовательским центром контроля и диагностики технических систем на основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 ВНЕСЕН Управлением технического регулирования и стандартизации Федерального агентства по техническому регулированию и метрологии
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ 1.5 (подраздел 3.6)
1 Область применения
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
3 Термины и определения
В настоящем стандарте применены термины по ГОСТ Р 50779.10.
4 Условия применения методов
Результаты испытаний представлены результатами измерений непрерывной величины. Настоящий стандарт не охватывает обработку результатов испытаний, когда исследуемая величина является дискретной (например, наличие или отсутствие свойства, количество дефектов).
Предположение о нормальности очень широко используют: распределение результатов, полученных в условиях испытаний, обычно нормальное или почти нормальное распределение.
Может быть, однако, полезным проверить предположение о нормальности распределения с помощью соответствующих методов. Вычисления могут быть упрощены изменением начала координат или единицы измерения результатов испытаний, но округлять эти результаты не рекомендуется. Недопустимо отбрасывать любые результаты наблюдений или применять любые корректировки к очевидно неопределенным наблюдениям, не подкрепленные доказательствами на экспериментальной, технической или какой-либо другой основе, которая должна быть четко установлена.
Метод испытаний может быть источником систематических ошибок, которые в настоящем стандарте не определены. Однако существование таких ошибок может сделать неприменимыми методы, изложенные далее.
В частности, если имеет место несистематическое смещение, увеличение выборки размера не повлияет на смещение.
Методы, представленные в ГОСТ Р 50779.21, могут быть использованы в определенных случаях для идентификации систематических ошибок.
5 Точечная оценка среднего
5.1 Случай несгруппированных результатов
Среднее основного нормального распределения оценивают как среднее арифметическое результатов:
. (1)
5.2 Случай сгруппированных в классы результатов
Когда число результатов достаточно велико (например, более 50), может быть выгодно сгруппировать их в классы одинаковой ширины. В определенных случаях результаты могут быть получены уже сгруппированными в классы.
. (2)
. (3)
6 Доверительный интервал для среднего
Доверительный интервал для среднего совокупности вычисляют на основе оценок среднего и стандартного отклонения.
Альтернативный метод вычисления доверительного интервала с использованием размахов дан в приложении А.
6.1 Оценка стандартного отклонения
6.1.1 Случай несгруппированных результатов
, (4)
— общее число измерений;
— среднее арифметическое измерений, вычисленное по формуле (1).
Для упрощения вычислений рекомендуется использовать формулу
. (5)
6.1.2 Случай сгруппированных результатов
В случае группирования в классы формула для оценки стандартного отклонения имеет вид
, (6)
— общее число измерений;
— взвешенное среднее всех средних точек классов, вычисленное по формуле (3).
Для простоты вычислений рекомендуется использовать формулу
. (7)
В случае сгруппированных данных вычисленное значение может быть скорректировано (поправка Шеппарда). Поскольку эта поправка при правильно выбранной ширине класса невелика, ее вводят не всегда.
6.2 Доверительный интервал для среднего
Доверительный интервал определяется тем, какая выбрана доверительная вероятность (0,95 или 0,99), и тем, какой будет построен интервал (односторонний или двусторонний).
6.2.1 Двусторонний доверительный интервал
Двусторонний доверительный интервал для среднего совокупности определяют по следующим формулам:
а) для доверительной вероятности 0,95:
; (8)
б) для доверительной вероятности 0,99:
. (9)