Вычисление доверительного интервала в Microsoft Excel

Доверительные интервалы в Excel: значение, определение, построение и расчет

Вычисление доверительного интервала в Microsoft Excel

Расширенные функции Excel предлагают незаменимые и удобные методы для различных статистических расчетов и анализа. Одной из таких особенностей является интервал доверия, который используется для выражения степени неопределенности, связанной с исследованием.

Доверительные интервалы в excel — это оценка событий в сочетании с верификацией вероятностей.

Они обеспечивают вероятный диапазон выборочной пропорции или выборочного среднего от истинной доли / среднего, найденного в популяции и отображаются как: оценка +/- погрешность.

Функция доверительного интервала

В любом опросе и исследовании доверительные интервалы — отличный способ понять роль ошибок выборки в средних процентных показателях. Для любого опроса, поскольку исследователи всегда лишь изучают долю из более крупного расчета, в их оценках есть неопределенность, из-за чего будут ошибки выборки.

Доверительный интервал (ДИ) дает понимание о том, насколько средняя величина может колебаться. Он представляет собой диапазон значений, которые одинаково центрированы от известного среднего числа выборки.

Чем выше уровень доверия (в процентах), тем меньше интервал, более точными будут результаты.

Исследование образцов с большей изменчивостью или большим стандартным отклонением порождает более широкие доверительные интервалы в excel.

Существует соотношение обратного квадратного корня между ДИ и размерами выборки. Меньшие размеры генерируют более широкие ДИ, поэтому для получения более точных оценок или сокращения пороговой погрешности наполовину, необходимо примерно в четыре раза увеличить размер выборки.

Построение среднего значения совокупности

Чтобы построить доверительный интервал для среднего значения совокупности, предоставленной вероятности и размера выборки, нужно применить функцию “ДОВЕРИТ” в Excel, которая использует нормальное распределение для вычисления значения доверия.

Предположим, исследователи случайно выбрали 100 человек, измерили их вес и установили средний в 76 кг.

Если нужно узнать средний показатель для людей в конкретном городе, маловероятно, что он для более крупной группы будет иметь такое же среднее значение, как и выборка, состоящая всего из 100 человек.

Гораздо более вероятно, что выборочное среднее в 76 кг может быть приблизительно равно (неизвестному) популяционному среднему, и нужно знать, насколько точным является оценочный ответ. Эта неопределенность, связанная с оценкой интервалов, называется уровнем достоверности, обычно 95%.

Функция “ДОВЕРИТ” (альфа, сигма, n) возвращает значение, используемое для построения ДИ среднего числа совокупности. Предполагается, что данные выборок соответствуют стандартным нормальным распределениям с известной сигмой стандартного отклонения, а размер выборки равен n.

Перед тем как рассчитать доверительный интервал в excel 95% уровня, принимают альфу как 1 – 0,95 = 0,05.

Функция CONFIDENCE или ДОВЕРИТ, определяется пределами доверия — это нижняя и верхняя границы ДИ и являются 95% показателями. Например, при изучении предпочтении, было обнаружено, что 70% людей предпочитают Боржоми , по сравнению с Пепси при ДИ в 3% и уровнем доверия 95%, тогда существует 95-процентная вероятность того, что истинная пропорция составляет от 67 до 73%.

Функции “ДОВЕРИТ” отображаются под различными синтаксисами в разных версиях Excel. Например, Excel 2010 имеет две функции: “ДОВЕРИТ.НОРМ” и “ДОВЕРИТ.T”, которые помогают вычислять ширину “ДИ. ДОВЕРИТ.

НОРМ” используется, когда известно стандартное отклонение измерения. В противном случае применяется “ДОВЕРИТ.T”, оценка осуществляется по данным выборки. Доверительные интервалы в excel до 2010 года имели только функцию “ДОВЕРИТ”.

Его аргументы и результаты были аналогичными аргументам функции “ДОВЕРИТ.НОРМ”.

Первый по-прежнему доступен в более поздних версиях Excel для обеспечения совместимости. #NUM! Error — происходит, если альфа меньше или равна 0, или больше или равна 0. Данное стандартное отклонение меньше или равно 0. Указанный размер аргумента меньше единицы. #СТОИМОСТЬ! Error — происходит, если любой из предоставленных аргументов не является числовым.

Функция интерполяции доверия

“ДОВЕРИТ.” классифицируется по функциям статистики и будет высчитывать и возвращать ДИ для среднего значения. Доверительные интервалы в excel могут быть чрезвычайно полезными для финансового анализа.

Как аналитик, “ДОВЕРИТ.” помогает в прогнозировании и корректировке для широкого круга целей, путем оптимизации принятия финансовых решений.

Это выполняется с применением графического отображения данных в наборе переменных.

Аналитики могут принимать более эффективные решения на основе статистической информации, предоставляемой нормальным распределением. Например, они могут найти связь между полученным доходом и расходами, затрачиваемыми на предметы роскоши.

Чтобы вычислить ДИ для среднего значения совокупности, возвращаемое доверительное значение, должно быть добавлено и вычтено из среднего значения выборки. Например, для среднего значения выборки x: Доверительный интервал = x ± ДОВЕРИТ.

Пример расчета доверительного интервала в excel – предположим, что нам даны следующие данные:

  1. Уровень значимости: 0,05.
  2. Стандартное отклонение населения: 2,5.
  3. Размер выборки: 100.

Функция доверительного интервала Excel используется для расчета ДИ со значением 0,05 (т. е.

уровень достоверности 95%) для среднего времени выборки для изучения времени коммутации в офисе на 100 человек.

Среднее значение образца составляет 30 минут, а стандартное отклонение составляет 2,5 минуты. Доверительный интервал составляет 30 ± 0,48999, что соответствует диапазону 29,510009 и 30,48999 (минут).

Интервалы и нормальное распределение

Наиболее знакомое использование доверительного интервала, означает «погрешность ошибок». В опросах погрешность составляет плюс или минус 3%.

ДИ полезны в контекстах, которые выходят за рамки этой простой ситуации. Они могут использоваться с ненормальными распределениями, которые сильно искажены.

Для вычисления прогноза доверительного интервала в excel требуются следующие строительные блоки:

  1. Среднее значение.
  2. Стандартное отклонение наблюдений.
  3. Число опросов в выборке.
  4. Уровень доверия, который нужно применить к ДИ.

Перед тем как построить доверительный интервал в excel, изучают его вокруг среднего значения выборки, начинают с принятия решения о том, какой будет принят процент других средств выборки, если они были собраны и рассчитаны в этом интервале. Если это так , то 95% возможных образцов будут захвачены ДИ с 1,96 стандартных отклонений выше и ниже образца.

Стандартная ошибка среднего

Допустимый интервал или погрешность не принимаются с учетом ошибки измерения или смещения обзора, поэтому фактическая неопределенность может быть выше, чем указана. Перед тем как посчитать доверительный интервал в excel, расчет должен быть обеспечен хорошим сбором данных, надежными измерительными системами и удовлетворительным дизайном обследования.

Доверительные интервалы для среднего значения могут быть получены несколькими способами: с помощью SigmaXL, описательной статистики, гистограмм,1-образного t-теста и интервалов доверия, односторонних диаграмм ANOVA и Multi-Vari.

Чтобы графически иллюстрировать ДИ для среднего значения «Удовлетворенность», создают диаграмму Multi-Vari (с 95% CI Mean Options) с использованием данных Customer Data.xls. Точки соответствуют отдельным данным.

Маркеры показывают максимальный доверительный предел 99%, и средний 95%-ый предел.

Теперь тестирование гипотезы будут использоваться для более точных средних оценок удовлетворенности и определения статистическая значимость результатов.

Доверительные интервалы очень важны для понимания полученных данных и принятия решений по ним. Чтобы рассчитать ДИ для дискретной пропорции, используют SigmaXL> Шаблоны и калькуляторы> Основные статистические шаблоны> 1 интервал доверительных отношений. Перед тем как найти доверительный интервал в excel, выполняют следующие действия:

  1. Открыть Client Data.xls.
  2. Нажать вкладку «Лист 1» или F4, чтобы активировать последний рабочий лист. Нажать SigmaXL> Статистические инструменты> Описательная статистика.
  3. Установить флажок «Использовать всю таблицу данных».
  4. Нажать «Далее».
  5. Выбрать «Общая удовлетворенность», нажать «Числовые переменные данных» (Y).
  6. Выбрать «Тип клиента», нажать «Категория группы» (X1). По умолчанию уровень доверия 95%.
  7. Нажать «ОК».

Обратить внимание, что доверительный интервал в 95% означает: в среднем истинный параметр популяции (средний, стандартное отклонение или пропорция) будет находиться в интервале 19 раз из 20.

Будет представлен пользователю: 95%-ый доверительный интервал для каждого отсчета. Среднее значение (95% CI).

Доверительный интервал 95% для стандартного отклонения (95% CI Sigma — не путать это с уровнем качества Sigma Process).

Статистика и уровни доверия

Доверительный интервал не является числом, в котором истинное значение параметра найдено с точностью. Действительно, случайная величина теоретически может принимать все возможные значения в рамках законов физики.

Доверительный интервал — это фактически область, в которой истинное (неизвестное) значение параметра, изучаемого в популяции, наиболее вероятно с вероятностью, которую выбирают.

При его использовании интервал основан на вычислении доверительного порога, погрешности и коэффициента запаса.

Перед тем как определить доверительный интервал в excel, определяют эти элементы, которые зависят от параметров:

  1. Изменчивости измеряемых характеристик.
  2. Размера выборки: чем она больше, тем более высокая точность.
  3. Метода отбора проб.
  4. Уровень доверия – s.

Уровень доверия представляет собой гарантированную уверенность. Например, с уровнем достоверности 90%, это означает, что 10% риск будет неправильным. Как правило, хорошей практикой является выбор достоверности в 95%.

Таким образом, максимальный доверительный уровень является большим, чем больше размер выборки. Маржинальный коэффициент является индикатором, выведенным непосредственно из доверительного порога.

В таблице приведены некоторые примеры для наиболее распространенных значений.

Уровень доверия sКоэффициент маржи при n> 30
80%1,28
85%1,44
90%1645
95%1,96
96%2,05
98%2,33
99%2575

Индикаторы для расчета

В случае когда нужно оценить среднее значение популяции из ее выборки, определяют доверительный интервал. Он зависит от размера выборки и закона переменной. Формула для расчета доверительного интервала в excel выглядит следующим образом:

  1. Нижняя граница интервала = средний пробег — коэффициент поля * стандартную ошибку.
  2. Верхняя граница диапазона = примерный средний + коэффициент поля * стандартную ошибку .
  3. Значение t будет зависеть от размера выборки: n> 30: коэффициент запаса нормального закона, называемый z. n «Макет»> «Панель ошибок»> «Дополнительные параметры панели». В появившемся всплывающем меню можно либо выбрать положительные или отрицательные панели ошибок, либо и то, и другое. Можно выбрать стиль и выбрать сумму, которую нужно отобразить. Это может быть фиксированное значение, процент, стандартное отклонение или настраиваемый диапазон.

    Если у данных есть стандартное отклонение по умолчанию для каждой точки, выбирают пользовательский и нажимают кнопку «Определить значение». Затем появляется другое всплывающее меню и можно выбрать диапазон ячеек как для положительных, так и для отрицательных панелей.

    Порядок строительства диаграммы:

    1. Подготовить данные. Сначала в дополнение к средним значениям, понадобится расчет стандартного отклонения (или ошибки).
    2. Затем в строке 4 нужно рассчитать верхний предел группы, то есть для B4 расчет будет: =B2+B3 В строке 5 нужно рассчитать нижний предел диапазона, т. е Для B5 расчет будет: =B2-B4
    3. Создать график. Выделите строки 1, 2, 4 и 5 таблицы, а затем нажать «Вставить»> «График»> «Линейная диаграмма». Excel создаст линейную диаграмму.
    4. Удалить легенду и линии сетки.
    5. Затем щелкнуть правой кнопкой мыши верхнюю группу диапазонов и выбрать «Изменить тип диаграммы».
    6. Отформатировать доверительные диапазоны. Чтобы закончить диаграмму просто отформатировать верхнюю серию с голубым заполнением (в соответствии с синей линией), а нижнюю серию — белой заливкой.

    В этой диаграмме легко увидеть пределы ошибок, однако если много данных, вид будет беспорядочный. С первого взгляда доверительный предел гораздо более очевидный, учитывая среднее значение выборки, и он будет становиться все более жестким по мере увеличения количества выборок

    Источник: //fb.ru/article/401522/doveritelnyie-intervalyi-v-excel-znachenie-opredelenie-postroenie-i-raschet

    Форматы функции CONFIDENCE

    Функция CONFIDENCE или ДОВЕРИТ, определяется пределами доверия — это нижняя и верхняя границы ДИ и являются 95% показателями. Например, при изучении предпочтении, было обнаружено, что 70% людей предпочитают Боржоми , по сравнению с Пепси при ДИ в 3% и уровнем доверия 95%, тогда существует 95-процентная вероятность того, что истинная пропорция составляет от 67 до 73%.

    Функции «ДОВЕРИТ» отображаются под различными синтаксисами в разных версиях Excel. Например, Excel 2010 имеет две функции: «ДОВЕРИТ.НОРМ» и «ДОВЕРИТ.T», которые помогают вычислять ширину «ДИ. ДОВЕРИТ.

    НОРМ» используется, когда известно стандартное отклонение измерения. В противном случае применяется «ДОВЕРИТ.T», оценка осуществляется по данным выборки. Доверительные интервалы в excel до 2010 года имели только функцию «ДОВЕРИТ».

    Его аргументы и результаты были аналогичными аргументам функции «ДОВЕРИТ.НОРМ».

    Первый по-прежнему доступен в более поздних версиях Excel для обеспечения совместимости. #NUM! Error — происходит, если альфа меньше или равна 0, или больше или равна 0. Данное стандартное отклонение меньше или равно 0. Указанный размер аргумента меньше единицы. #СТОИМОСТЬ! Error — происходит, если любой из предоставленных аргументов не является числовым.

    Расчет с помощью SigmaXL

    Доверительные интервалы очень важны для понимания полученных данных и принятия решений по ним. Чтобы рассчитать ДИ для дискретной пропорции, используют SigmaXL> Шаблоны и калькуляторы> Основные статистические шаблоны> 1 интервал доверительных отношений. Перед тем как найти доверительный интервал в excel, выполняют следующие действия:

  4. Открыть Client Data.xls.
  5. Нажать вкладку «Лист 1» или F4, чтобы активировать последний рабочий лист. Нажать SigmaXL> Статистические инструменты> Описательная статистика.
  6. Установить флажок «Использовать всю таблицу данных».
  7. Нажать «Далее».
  8. Выбрать «Общая удовлетворенность», нажать «Числовые переменные данных» (Y).
  9. Выбрать «Тип клиента», нажать «Категория группы» (X1). По умолчанию уровень доверия 95%.
  10. Нажать «ОК».
  11. Обратить внимание, что доверительный интервал в 95% означает: в среднем истинный параметр популяции (средний, стандартное отклонение или пропорция) будет находиться в интервале 19 раз из 20.

    Будет представлен пользователю: 95%-ый доверительный интервал для каждого отсчета. Среднее значение (95% CI).

    Доверительный интервал 95% для стандартного отклонения (95% CI Sigma — не путать это с уровнем качества Sigma Process).

    Способы расчета доверительного интервала

    Вычисление доверительного интервала в Microsoft Excel

    21 апреля 2016

    Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов.

    Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал.

    Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.

    Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.

    Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.

    Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:

    • через медиану и среднеквадратическое отклонение;
    • через критическое значение t-статистики (коэффициент Стьюдента).

    Этапы сравнительного анализа разных способов расчета ДИ:

    1. формируем выборку данных;

    2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;

    3. рассчитываем доверительный интервал двумя способами;

    4. анализируем очищенные выборки и полученные доверительные интервалы.

    Этап 1. Выборка данных

    Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».

    Таблица 1. Исходная выборка

    Цена 1 кв.м., д.е.
    150943
    235000
    351613
    450645
    549841
    8658772
    8770714
    8853393
    8954876
    9052542
    9156140

    Рис.1. Исходная выборка

    Этап 2. Обработка исходной выборки

    Обработка выборки методами статистики требует вычисления следующих значений:

    1. Среднее арифметическое значение

    2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы

    (для выборки, имеющей нечетное число значений)

    3. Размах – разница между максимальным и минимальным значениями в выборке

    4. Дисперсия – используется для более точного оценивания вариации данных

    5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.

    6. Коэффициент вариации – отражает степень разбросанности значений корректировок

    7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней

    Таблица 2. Статистические показатели исходной выборки

    ПоказательЗначение
    Ср. значение54970
    Медиана53934
    Размах39194
    Дисперсия45126821
    СКО6755
    Коэф. вариации12,29%
    Коэф. осциляции71,30%

    Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.

    Этап 3. Расчёт доверительного интервала

    Способ 1. Расчёт через медиану и среднеквадратическое отклонение.

    Доверительный интервал определяется следующим образом: минимальное значение – из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.

    Формула доверительного интервала:

    Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)

    Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.

    Рис. 2. Значения, попавшие в доверительный интервал 1.

    Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)

    С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента.

    При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99.

    При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).

    Формула доверительного интервала:

    n – объем выборки;

    – критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel (  →”Статистические”→ СТЬЮДРАСПОБР);

    ∝ – уровень значимости, принимаем ∝=0,01.

    Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.

    Рис. 2. Значения, попавшие в доверительный интервал 2.

    Этап 4. Анализ разных способов расчета доверительного интервала

    Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.

    Таблица 3. Статистические показатели по трем выборкам.

    ПоказательИсходная выборка1 вариант2 вариант
    Среднее значение549705359354750
    Медиана539345342554688
    Размах39194128883677
    Дисперсия4512682189196451228707
    СКО675530081128
    Коэф. вариации12,29%5,61%2,06%
    Коэф. осциляции71,30%24,05%6,72%
    Количество выбывших объектов, шт.2062

    На основании выполненных расчетов можно сказать, что полученные разными методами значения доверительных интервалов пересекаются, поэтому можно использовать любой из способов расчета на усмотрение оценщика.

    Однако мы считаем, что при работе в системе estimatica.pro целесообразно выбирать метод расчета доверительного интервала в зависимости от степени развитости рынка:

    • если рынок неразвит, применять метод расчета через медиану и среднеквадратическое отклонение, так как количество выбывших объектов в этом случае невелико;
    • если рынок развит, применять расчет через критическое значение t-статистики (коэффициент Стьюдента), так как есть возможность сформировать большую исходную выборку.

    При подготовке статьи были использованы:

    1. Грибовский С.В., Сивец С.А., Левыкина И.А. Математические методы оценки стоимости имущества. Москва, 2014 г.

    2. Данные системы estimatica.pro

    Источник: //www.estimatica.info/assessment/standards-and-methods/192-sposoby-rascheta-doveritelnogo-intervala

    Доверительный интервал для оценки среднего (дисперсия известна) в MS EXCEL

    Вычисление доверительного интервала в Microsoft Excel

    Построим в MS EXCEL доверительный интервал для оценки среднего значения распределения в случае известного значения дисперсии.

    В статье Статистики, выборочное распределение и точечные оценки в MS EXCEL дано определение точечной оценки параметра распределения (point estimator).

    Однако, в силу случайности выборки, точечная оценка не совпадает с оцениваемым параметром и более разумно было бы указывать интервал, в котором может находиться неизвестный параметр при наблюденной выборке х1, x2, …, хn.

    Поэтому цель использования доверительных интервалов состоит в том, чтобы по возможности избавиться от неопределенности и сделать как можно более полезный статистический вывод.

    Примечание: Процесс обобщения данных выборки, который приводит к вероятностным утверждениям обо всей генеральной совокупности, называют статистическим выводом (statistical inference).

    СОВЕТ: Для построения Доверительного интервала нам потребуется знание следующих понятий:

    К сожалению, интервал, в котором может находиться неизвестный параметр, совпадает со всей возможной областью изменения этого параметра, поскольку соответствующую выборку, а значит и оценку параметра, можно получить с ненулевой вероятностью. Поэтому приходится ограничиваться нахождением границ изменения неизвестного параметра с некоторой заданной наперед вероятностью.

    Определение: Доверительным интервалом называют такой интервал изменения случайной величины, которыйс заданной вероятностью, накроет истинное значение оцениваемого параметра распределения.

    Эту заданную вероятность называют уровнем доверия (или доверительной вероятностью).

    Обычно используют значения уровня доверия 90%; 95%; 99%, реже 99,9% и т.д. Например, уровеньдоверия 95% означает, что дополнительное событие, вероятность которого 1-0,95=5%, исследователь считает маловероятным или невозможным.

    ПримечаниеВероятность этого дополнительного события называется уровень значимости или ошибка первого рода. Подробнее см. статью Уровень значимости и уровень надежности в MS EXCEL.

    Разумеется, выбор уровня доверия полностью зависит от решаемой задачи. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.

    ПримечаниеПостроение доверительного интервала в случае, когда стандартное отклонение неизвестно, приведено в статье Доверительный интервал для оценки среднего (дисперсия неизвестна) в MS EXCEL. О построении других доверительных интервалов см. статью Доверительные интервалы в MS EXCEL.

    Формулировка задачи

    Предположим, что из генеральной совокупности имеющей нормальное распределение взята выборка размера n. Предполагается, что стандартное отклонение этого распределения известно. Необходимо на основании этой выборки оценить неизвестное среднее значение распределения (μ, математическое ожидание) и построить соответствующий двухсторонний доверительный интервал.

    Точечная оценка

    Как известно из Центральной предельной теоремы, статистика (обозначим ее Хср) является несмещенной оценкой среднего этой генеральной совокупности и имеет распределение N(μ;σ2/n).

    Примечание: Что делать, если требуется построить доверительный интервал в случае распределения, которое не является нормальным? В этом случае на помощь приходит Центральная предельная теорема, которая гласит, что при достаточно большом размере выборки n из распределения не являющемся нормальным, выборочное распределение статистики Хср будет приблизительно соответствовать нормальному распределению с параметрами N(μ;σ2/n).

    Итак, точечная оценка среднего значения распределения у нас есть – это среднее значение выборки, т.е. Хср. Теперь займемся доверительным интервалом.

    Построение доверительного интервала

    Обычно, зная распределение и его параметры, мы можем вычислить вероятность того, что случайная величина примет значение из заданного нами интервала. Сейчас поступим наоборот: найдем интервал, в который случайная величина попадет с заданной вероятностью.

    Например, из свойств нормального распределения известно, что с вероятностью 95%, случайная величина, распределенная по нормальному закону, попадет в интервал примерно +/- 2 стандартных отклонения от среднего значения (см. статью про нормальное распределение).

    Этот интервал, послужит нам прототипом для доверительного интервала.

    Теперь разберемся,знаем ли мы распределение, чтобы вычислить этот интервал? Для ответа на вопрос мы должны указать форму распределения и его параметры.

    Форму распределения мы знаем – это нормальное распределение (напомним, что речь идет о выборочном распределении статистики Хср).

    Параметр μ нам неизвестен (его как раз нужно оценить с помощью доверительного интервала), но у нас есть его оценка Хср, вычисленная на основе выборки, которую можно использовать.

    Второй параметр – стандартное отклонение выборочного среднего будем считать известным, он равен σ/√n.

    Т.к. мы не знаем μ, то будем строить интервал +/- 2 стандартных отклонения не от среднего значения, а от известной его оценки Хср. Т.е.

    при расчете доверительного интервала мы НЕ будем считать, что Хср попадет в интервал +/- 2 стандартных отклонения от μ с вероятностью 95%, а будем считать, что интервал +/- 2 стандартных отклонения от Хср с вероятностью 95% накроет μ – среднее генеральной совокупности, из которого взята выборка. Эти два утверждения эквивалентны, но второе утверждение нам позволяет построить доверительный интервал.

    Кроме того, уточним интервал: случайная величина, распределенная по нормальному закону, с вероятностью 95% попадает в интервал +/- 1,960 стандартных отклонений, а не+/- 2 стандартных отклонения. Это можно рассчитать с помощью формулы =НОРМ.СТ.ОБР((1+0,95)/2), см. файл примера Лист Интервал.

    Теперь мы можем сформулировать вероятностное утверждение, которое послужит нам для формирования доверительного интервала:
    «Вероятность того, что среднее генеральной совокупности находится от среднего выборки в пределах 1,960 «стандартных отклонений выборочного среднего», равна 95%».

    Значение вероятности, упомянутое в утверждении, имеет специальное название уровень доверия, который связан с уровнем значимости α (альфа) простым выражением уровень доверия =1-α. В нашем случае уровень значимости α=1-0,95=0,05.

    Теперь на основе этого вероятностного утверждения запишем выражение для вычисления доверительного интервала:

    где Zα/2 – верхний α/2-квантиль стандартного нормального распределения (такое значение случайной величины z, что P(z>=Zα/2)=α/2).

    Примечание: Верхний α/2-квантиль определяет ширину доверительного интервала в стандартных отклонениях выборочного среднего. Верхний α/2-квантиль стандартного нормального распределения всегда больше 0, что очень удобно.

    В нашем случае при α=0,05, верхний α/2-квантиль равен 1,960. Для других уровней значимости α (10%; 1%) верхний α/2-квантиль Zα/2 можно вычислить с помощью формулы =НОРМ.СТ.ОБР(1-α/2) или, если известен уровень доверия, =НОРМ.СТ.ОБР((1+ур.доверия)/2).

    Обычно при построении доверительных интервалов для оценки среднего используют только верхний α/2-квантиль и не используют нижний α/2-квантиль.

    Это возможно потому, что стандартное нормальное распределение симметрично относительно оси х (плотность его распределения симметрична относительно среднего, т.е. 0).

    Поэтому, нет нужды вычислять нижний α/2-квантиль (его называют просто α/2-квантиль), т.к. он равен верхнему α/2-квантилю со знаком минус.

    Напомним, что, не смотря на форму распределения величины х, соответствующая случайная величина Хср распределена приблизительно нормально N(μ;σ2/n) (см. статью про ЦПТ).

    Следовательно, в общем случае, вышеуказанное выражение для доверительного интервала является лишь приближенным.

    Если величина х распределена по нормальному закону N(μ;σ2/n), то выражение для доверительного интервала является точным.

    Расчет доверительного интервала в MS EXCEL

    Решим задачу.
    Время отклика электронного компонента на входной сигнал является важной характеристикой устройства.

    Инженер хочет построить доверительный интервал для среднего времени отклика при уровне доверия 95%. Из предыдущего опыта инженер знает, что стандартное отклонение время отклика составляет 8 мсек.

    Известно, что для оценки времени отклика инженер сделал 25 измерений, среднее значение составило 78 мсек.

    Решение: Инженер хочет знать время отклика электронного устройства, но он понимает, что время отклика является не фиксированной, а случайной величиной, которая имеет свое распределение. Так что, лучшее, на что он может рассчитывать, это определить параметры и форму этого распределения.

    К сожалению, из условия задачи форма распределения времени отклика нам не известна (оно не обязательно должно быть нормальным). Среднее, т.е. математическое ожидание, этого распределения также неизвестно. Известно только его стандартное отклонение σ=8. Поэтому, пока мы не можем посчитать вероятности и построить доверительный интервал.

    Однако, не смотря на то, что мы не знаем распределение времениотдельного отклика, мы знаем, что согласно ЦПТ, выборочное распределение среднего времени отклика является приблизительно нормальным (будем считать, что условия ЦПТ выполняются, т.к. размер выборки достаточно велик (n=25)).

    Более того, среднее этого распределения равно среднему значению распределения единичного отклика, т.е. μ. А стандартное отклонение этого распределения (σ/√n) можно вычислить по формуле =8/КОРЕНЬ(25).

    Также известно, что инженером была получена точечная оценка параметра μ равная 78 мсек (Хср). Поэтому, теперь мы можем вычислять вероятности, т.к. нам известна форма распределения (нормальное) и его параметры (Хср и σ/√n).

    Инженер хочет знать математическое ожидание μ распределения времени отклика. Как было сказано выше, это μ равно математическому ожиданию выборочного распределения среднего времени отклика. Если мы воспользуемся нормальным распределением N(Хср; σ/√n), то искомое μ будет находиться в интервале +/-2*σ/√n с вероятностью примерно 95%.

    Уровень значимости равен 1-0,95=0,05.

    Наконец, найдем левую и правую границу доверительного интервала.
    Левая граница: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)=74,864
    Правая граница: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)=81,136

    или так

    Левая граница: =НОРМ.ОБР(0,05/2; 78; 8/КОРЕНЬ(25))
    Правая граница: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРЕНЬ(25))

    Ответ: доверительный интервал при уровне доверия 95% и σ=8 мсек равен 78+/-3,136 мсек.

    В файле примера на листе Сигма известна создана форма для расчета и построения двухстороннего доверительного интервала для произвольных выборок с заданным σ и уровнем значимости.

    Функция ДОВЕРИТ.НОРМ()

    Если значения выборки находятся в диапазоне B20:B79, а уровень значимости равен 0,05; то формула MS EXCEL:
    =СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; СЧЁТ(B20:B79))
    вернет левую границу доверительного интервала.

    Эту же границу можно вычислить с помощью формулы:
    =СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРЕНЬ(СЧЁТ(B20:B79))

    Примечание: Функция ДОВЕРИТ.НОРМ() появилась в MS EXCEL 2010. В более ранних версиях MS EXCEL использовалась функция ДОВЕРИТ().

    Источник: //excel2.ru/articles/doveritelnyy-interval-dlya-ocenki-srednego-dispersiya-izvestna-v-ms-excel

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.