Open
Close

Як визначити довірчий інтервал. Довірчі інтервали. Також зручні для практики значення сигма

Побудуємо в MS EXCEL довірчий інтервал з метою оцінки середнього значення розподілу у разі відомого значення дисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону, потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді питання ми повинні вказати форму розподілу та її параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значущості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за такою формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичного очікування вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Костянтин Кравчик дохідливо пояснює, що таке довірчий інтервал у медичних дослідженнях та як його використовувати

"Катрен-Стиль" продовжує публікацію циклу Костянтина Кравчика про медичну статистику. У попередніх статтях автор стосувався пояснення таких понять, як і .

Костянтин Кравчик

Математик-аналітик. Спеціаліст у галузі статистичних досліджень у медицині та гуманітарних науках

Місто Москва

Дуже часто в статтях з клінічних досліджень можна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, у статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдента з розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке довірчий інтервал? - Це діапазон, в якому знаходяться справжні середні значення у генеральній сукупності. А що, бувають несправжні середні значення? У певному сенсі так, бувають. Ми пояснювали, що неможливо виміряти цікавий параметр у всій генеральній сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, за масою тіла) є одне середнє значення (певна вага), за яким ми і судимо про середнє значення у всій генеральній сукупності. Однак навряд чи середня вага у вибірці (особливо невелика) збігається із середньою вагою в генеральній сукупності. Тому більш правильно розраховувати та користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявимо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г/л. Це означає, що з ймовірністю 95% справжнє середнє значення по гемоглобіну в генеральній сукупності перебуватиме в межах від 110 до 122 г/л. Іншими словами, ми не знаємо середній показник гемоглобіну в генеральній сукупності, але можемо з 95% ймовірністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці середніх значеннях між групами або, як це називають, у розмірі ефекту.

Припустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і щойно зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам визнала, що різниця між середніми значеннями двох груп з ймовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г/л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(порівнюються групи за рівнем гемоглобіну)

Трактувати це слід так: у частини пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вищим у середньому на 1,72–14,36 г/л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральній сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% ймовірністю знаходиться в цих межах. Судити, багато це чи мало буде вже дослідник. Сенс всього цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми вірогідніше оцінюємо різницю за параметром між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати чи розширювати межі довірчого інтервалу. Знижуючи ймовірність довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від –1 до 16 г/л. Це означає, що в генеральній сукупності є групи, відмінність середніх між якими за ознакою, що вивчається, дорівнює 0 (М = 0).

З допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, яка передбачає, що групи не відрізняються за параметром, що вивчається, вірна. Приклад описаний вище, коли ми розширили межі до 99%. Десь у генеральній сукупності у нас знайшлися групи, які не відрізнялися.

95% довірчий інтервал різниці по гемоглобіну, (г/л)


На малюнку у вигляді лінії зображено 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не відрізняються. Діапазон різниці між групами лежить від -2 до 5 г/л. Це означає, що гемоглобін може знизитися на 2 г/л, так і підвищитися на 5 г/л.

Довірчий інтервал – дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, тому що при великій вибірці шанси знайти відмінності більше, ніж за малої.

Насправді це може виглядати так. Ми взяли вибірку в 1000 осіб, виміряли рівень гемоглобіну та виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г/л. Рівень статистичної значущості у своїй p

Ми бачимо, що концентрація гемоглобіну підвищилася, але практично непомітно, отже, статистична значимість з'явилася за рахунок обсягу вибірки.

Довірчий інтервал може бути вирахований як для середніх значень, але й пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблені ліки. Припустимо, що 95% ДІ для пропорцій, тобто для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки мають терапевтичний ефект від 60 до 80% випадків.

Ймовірності, визнані достатніми для того, щоб впевнено судити про генеральні параметри на підставі вибіркових характеристик, називають довірчими .

Зазвичай, як довірчі ймовірності вибирають значення 0,95; 0,99; 0,999 (їх прийнято виражати у відсотках – 95%, 99%, 99,9%). Що міра відповідальності, то вищий рівень довірчої ймовірності: 99% чи 99,9%.

Довірча ймовірність 0,95 (95%) вважається достатньою у наукових дослідженнях у галузі фізичної культури та спорту.

Інтервал, у якому із заданою довірчою ймовірністю знаходиться вибіркове середнє арифметичне генеральне сукупність, називається довірчим інтервалом .

Рівень значущості оцінювання- мале число α, значення якого передбачає ймовірність того, що виходить за межі довірчого інтервалу. Відповідно до довірчих ймовірностей: α 1 = (1- 0,95) = 0, 05; α 2 = (1 - 0,99) = 0, 01 і т.д.

Довірчий інтервал для середнього (математичного очікування) aнормального розподілу:

,

де – надійність (довірча ймовірність) оцінювання; - вибіркове середнє; s - виправлене середньоквадратичне відхилення; n – обсяг вибірки; t γ - величина, що визначається за таблицею розподілу Стьюдента (див. додаток, табл. 1) при заданих n та γ.

Щоб знайти межі довірчого інтервалу середнього значення генеральної сукупності необхідно:

1. Обчислити та s.

2. Слід задатися довірчою ймовірністю (надійністю) оцінювання γ 0,95 (95 %) або рівнем значимості α 0,05 (5 %)

3. По таблиці t – розподілу Стьюдента (додаток, табл. 1) визначити граничні значення t γ .

Так як t-розподіл симетрично щодо нульової точки, достатньо знати лише позитивне значення t. Наприклад, якщо обсяг вибірки n=16, то число ступенів свободи (degrees of freedom, df) t- Розподілу df=16 - 1=15 . За табл. 1 додатку t 0,05 = 2,13 .

4. Знаходимо межі довірчого інтервалу для α = 0,05 та n = 16:

Межі довіри:

При більших обсягах вибірки (n ≥ 30) t – розподіл Стьюдента перетворюється на нормальне. Тому довірчий інтервал для при n ≥ 30 можна записати так:

де u- Відсоткові точки нормованого нормального розподілу.

Для стандартних довірчих ймовірностей (95%, 99%; 99, 9%) та рівнів значущості α значення ( u) наведені у таблиці 8.

Таблиця 8

Значення для стандартних рівнів довіри α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Маючи дані прикладу 1, визначимо межі 95 % - го довірчого інтервалу (α = 0,05) для середнього результату стрибка вгору з місця.У прикладі обсяг вибірки n = 65, тоді визначення меж довірчого інтервалу можна використовувати рекомендації великого обсягу вибірки.

З цієї статті ви дізнаєтесь:

    Що таке довірчий інтервал?

    В чому суть правила 3-х сигм?

    Як можна застосувати ці знання практично?

В наш час через надлишок інформації, пов'язаної з великим асортиментом товарів, напрямів продажу, співробітників, напрямів діяльності тощо, буває важко виділити головнеНа що, в першу чергу, варто звернути увагу і докласти зусиль для управління. Визначення довірчого інтервалута аналіз виходу за його межі фактичних значень - методика, яка допоможе вам виділити ситуації, що впливають зміну тенденцій.Ви зможете розвивати позитивні фактори та знизити вплив негативних. Ця технологія застосовується у багатьох відомих світових компаніях.

Існують так звані " оповіщення", які інформують керівниківпро те, що чергове значення у певному напрямку вийшло за довірчий інтервал. Що це означає? Це сигнал, що сталася якась нестандартна подія, яка, можливо, змінить існуючу тенденцію у цьому напрямі. Це сигналдо того, щоб розібратисяу ситуації та зрозуміти, що на неї вплинуло.

Наприклад, розглянемо кілька ситуацій. Ми розрахували прогноз продажу з межами прогнозу за 100 товарними позиціями на 2011 рік за місяцями та у березні фактичні продажі:

  1. По «Соняшниковій олії» пробили верхню межу прогнозу і не потрапили в довірчий інтервал.
  2. За «Сухими дріжджами» вийшли за нижню межу прогнозу.
  3. По «Вівсяним кашам» пробили верхній кордон.

За іншими товарами фактичні продажі опинилися у межах заданих меж прогнозу. Тобто. їх продаж опинився в рамках очікувань. Отже, ми виділили 3 товари, які вийшли за кордони, і почали розбиратися, що вплинуло на вихід за кордони:

  1. По «Соняшниковій олії» ми увійшли до нової торговельної мережі, яка дала нам додатковий обсяг продажів, що призвело до виходу за верхній кордон. Для цього товару варто перерахувати прогноз до кінця року з урахуванням прогнозу продажу цієї мережі.
  2. За «Сухими дріжджами» машина застрягла на митниці, і утворився дефіцит у рамках 5 днів, що вплинуло на зниження продажів та вихід за нижній кордон. Можливо, варто розібратися, що спричинило і постаратися не повторювати цю ситуацію.
  3. За «Вівсяними Кашами» було запущено захід зі стимулювання збуту, який дав значний приріст продажів та призвів до виходу за межі прогнозу.

Ми виділили 3 фактори, які вплинули на вихід за межі прогнозу. У житті їх може бути набагато більше. Для підвищення точності прогнозування та планування фактори, які призводять до того, що фактичні продажі можуть вийти за межі прогнозу, варто виділити та будувати прогнози та плани щодо них окремо. А потім враховувати їхній вплив на основний прогноз продажів. Також можна регулярно оцінювати вплив даних факторів і змінювати ситуацію на краще рахунок зменшення впливу негативних та збільшення впливу позитивних факторів.

За допомогою довірчого інтервалу ми можемо:

  1. Виділити напрямки, куди варто звернути увагу, т.к. у цих напрямках відбулися події, які можуть вплинути на зміна тенденції.
  2. Визначити факториякі реально впливають на зміну ситуації.
  3. Прийняти зважене рішення(Наприклад, про закупівлі, при плануванні і т.д.).

Тепер розглянемо, що таке довірчий інтервал та як його розрахувати в Excel на прикладі.

Що таке довірчий інтервал?

Довірчий інтервал – це межі прогнозу (верхня та нижня), в рамки яких із заданою ймовірністю (сигма)попадуть фактичні значення.

Тобто. ми розраховуємо прогноз - це наш основний орієнтир, але ми розуміємо, що фактичні значення навряд чи на 100% дорівнюватимуть нашому прогнозу. І виникає питання, у які межіможуть потрапити фактичні значення, якщо існуюча тенденція збережеться? І на це запитання нам допоможе відповісти розрахунок довірчого інтервалу, тобто. - верхньої та нижньої межі прогнозу.

Що таке ймовірність сигма?

При розрахункудовірчого інтервалу ми можемо задати ймовірність влученняфактичних значень у задані межі прогнозу. Як це зробити? Для цього ми задаємо значення сигма і, якщо сигма дорівнюватиме:

    3 сигма- то, ймовірність попадання чергового фактичного значення довірчий інтервал складуть 99,7%, або 300 до 1, або існує 0,3% ймовірності виходу за кордон.

    2 сигма- те, ймовірність попадання чергового значення кордону становить ≈ 95,5 %, тобто. шанси приблизно 20 до 1, чи існує 4,5% ймовірності виходу за кордон.

    1 сигма- те, ймовірність - 68,3%, тобто. шанси приблизно 2 до 1 або існує 31,7% ймовірність того, що чергове значення вийде за межі довірчого інтервалу.

Ми сформулювали правило 3 сигм,яке говорить, що ймовірність влученнячергового випадкового значення у довірчий інтерваліз заданим значенням три сигма складає 99.7%.

Великим російським математиком Чебишевим було доведено теорема у тому, що є 10% ймовірність виходу межі прогнозу із заданим значенням три сигма. Тобто. ймовірність попадання в довірчий інтервал 3 сигма складе мінімум 90%, тоді як спроба розрахувати прогноз і його межі «на око» загрожує значно суттєвішими помилками.

Як самостійно розрахувати довірчий інтервал у Excel?

Розрахунок довірчого інтервалу в Excel (тобто верхньої та нижньої межі прогнозу) розглянемо на прикладі. У нас є часовий ряд - продаж за місяцями за 5 років. Див. вкладений файл.

Для розрахунку меж прогнозу розрахуємо:

  1. Прогноз продажів().
  2. Сигма – середньоквадратичне відхиленнямоделі прогнозу від фактичних значень
  3. Три сигми.
  4. Довірчий інтервал.

1. Прогноз продажів.

=(RC[-14] (Дані в часовому ряду)- RC[-1] (Значення моделі))^2(у квадраті)


3. Підсумуємо кожного місяця значення відхилень з 8 етапу Сума((Xi-Ximod)^2), тобто. підсумуємо січневі, люті... для кожного року.

Для цього скористаємося формулою = СУМІСЛИ()

СУМІСЛИ (масив з номерами періодів усередині циклу (для місяців від 1 до 12); посилання на номер періоду в циклі; посилання на масив з квадратами різниці вихідних даних та значень періодів)


4. Розрахуємо середньоквадратичне відхилення для кожного періоду в циклі від 1 до 12 (10 етап у вкладеному файлі).

Для цього із значення розрахованого на 9 етапі ми витягуємо корінь і ділимо на кількість періодів у цьому циклі мінус 1 = КОРІНЬ((Сума(Xi-Ximod)^2/(n-1))

Скористаємося формулами в Excel = КОРІНЬ (R8 (посилання на (Сума(Xi-Ximod)^2)/(ПОЛІЧИЛИ($O$8:$O$67 (Посилання на масив з номерами циклу); O8 (Посилання на конкретний номер циклу, які рахуємо в масиві))-1))

За допомогою формули Excel = РАХУНКИми вважаємо кількість n


Розрахувавши середньоквадратичне відхилення фактичних даних від моделі прогнозу, ми набули значення сигму для кожного місяця - етап 10 у вкладеному файлі .

3. Розрахуємо 3 сигми.

На 11 етапі задаємо кількість сигм – у нашому прикладі «3» (11 етап у вкладеному файлі):

Також зручні для практики значення сигму:

1,64 сигма - 10% ймовірність виходу за межу (1 шанс із 10);

1,96 сигма - 5% ймовірність виходу за межі (1 шанс із 20);

2,6 сигма - 1% ймовірність виходу за межі (1 шанс зі 100).

5) Розраховуємо три сигмиДля цього ми значення «сигма» для кожного місяця множимо на «3».

3.Визначаємо довірчий інтервал.

  1. Верхня межа прогнозу- прогноз продажів з урахуванням зростання та сезонності + (плюс) 3 сигми;
  2. Нижня межа прогнозу- прогноз продажів з урахуванням зростання та сезонності – (мінус) 3 сигми;

Для зручності розрахунку довірчого інтервалу на тривалий період (див. вкладений файл) скористаємося формулою Excel =Y8+ВПР(W8;$U$8:$V$19;2;0), де

Y8- прогноз продажів;

W8- Номер місяця, для якого будемо брати значення 3-х сигма;

Тобто. Верхня межа прогнозу= "прогноз продажів" + "3 сигма" (у прикладі, ВПР(номер місяця; таблиця зі значеннями 3-х сигма; стовпець, з якого витягуємо значення сигма дорівнює номеру місяця у відповідному рядку;0)).

Нижня межа прогнозу= "Прогноз продажів" мінус "3 сигма".

Отже, ми розрахували довірчий інтервал Excel.

Тепер у нас є прогноз та діапазон із межами в межах, якого із заданою ймовірністю сигма потраплять фактичні значення.

У цій статті ми розглянули, що таке сигма і правило трьох сигм, як визначити довірчий інтервал і для чого ви можете використати цю методику на практиці.

Точних вам прогнозів та успіхів!

Чим Forecast4AC PRO може допомогти вампри розрахунку довірчого інтервалу?:

    Forecast4AC PRO автоматично розрахує верхню або нижню межі прогнозу більш ніж 1000 часових рядів одночасно;

    Можливість аналізу меж прогнозу порівняно з прогнозом, трендом та фактичними продажами на графіку одним натисканням клавіші;

У програмі Forcast4AC PRO можна задати значення сигма від 1 до 3.

Приєднуйся до нас!

Завантажуйте безкоштовні програми для прогнозування та бізнес-аналізу:


  • Novo Forecast Lite- автоматичний розрахунок прогнозув Excel.
  • 4analytics - ABC-XYZ-аналізта аналіз викидів у Excel.
  • Qlik Sense Desktop та QlikViewPersonal Edition - BI-системи для аналізу та візуалізації даних.

Тестуйте можливості платних рішень:

  • Novo Forecast PRO- прогнозування Excel для великих масивів даних.

Довірчі інтервали ( англ. Confidence Intervals) одним із типів інтервальних оцінок використовуваних у статистиці, які розраховуються для заданого рівня значущості. Вони дозволяють зробити твердження, що справжнє значення невідомого статистичного параметра генеральної сукупності перебуває у отриманому діапазоні значень із ймовірністю, що задана обраним рівнем статистичної значимості.

Нормальний розподіл

Коли відома варіація (σ 2) генеральної сукупності даних, для розрахунку довірчих меж (граничних точок довірчого інтервалу) може бути використана z-оцінка. Порівняно із застосуванням t-розподілу, використання z-оцінки дозволить побудувати не лише вужчий довірчий інтервал, а й отримати більш надійні оцінки математичного очікування та середньоквадратичного (стандартного) відхилення (σ), оскільки Z-оцінка ґрунтується на нормальному розподілі.

Формула

Для визначення граничних точок довірчого інтервалу, за умови, що відомо середньоквадратичне відхилення генеральної сукупності даних, використовується наступна формула

L = X - Z α/2 σ
√n

приклад

Припустимо, що розмір вибірки налічує 25 спостережень, математичне очікування вибірки дорівнює 15, а середньоквадратичне відхилення генеральної сукупності становить 8. Для рівня значущості = 5% Z-оцінка дорівнює Z / 2 = 1,96. У цьому випадку нижня та верхня межа довірчого інтервалу становитимуть

L = 15 – 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності потрапить до діапазону від 11,864 до 18,136.

Методи звуження довірчого інтервалу

Припустимо, що діапазон є надто широким для цілей нашого дослідження. Зменшити діапазон довірчого інтервалу можна двома способами.

  1. Зменшити рівень статистичної значущості α.
  2. Збільшити обсяг вибірки.

Зменшивши рівень статистичної значущості до α=10%, ми отримаємо Z-оцінку рівну Z α/2 =1,64. У цьому випадку нижня та верхня межа інтервалу становитимуть

L = 15 – 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

А сам довірчий інтервал може бути записаний у вигляді

У цьому випадку ми можемо зробити припущення, що з ймовірністю 90% математичне очікування генеральної сукупності потрапить у діапазон .

Якщо ми хочемо не знижувати рівень статистичної значущості α, то єдиною альтернативою залишається збільшення обсягу вибірки. Збільшивши її до 144 спостережень, отримаємо такі значення довірчих меж

L = 15 – 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Сам довірчий інтервал матиме такий вигляд

Таким чином, звуження довірчого інтервалу без зниження рівня статистичної значимості можливе лише за рахунок збільшення обсягу вибірки. Якщо збільшення обсягу вибірки неможливо, то звуження довірчого інтервалу може досягатися виключно з допомогою зниження рівня статистичної значимості.

Побудова довірчого інтервалу при розподілі відмінному від нормального

Якщо середньоквадратичне відхилення генеральної сукупності не відоме або розподіл відмінно від нормального, для побудови довірчого інтервалу використовується t-розподіл. Ця методика є більш консервативною, що виявляється у ширших довірчих інтервалах, порівняно з методикою, що базується на Z-оцінці.

Формула

Для розрахунку нижньої та верхньої межі довірчого інтервалу на підставі t-розподілу застосовуються наступні формули

L = X - t α σ
√n

Розподіл Стьюдента або t-розподіл залежить тільки від одного параметра – кількості ступенів свободи, яка дорівнює кількості індивідуальних значень ознаки (кількість спостережень у вибірці). Значення t-критерію Стьюдента для заданої кількості ступенів свободи (n) та рівня статистичної значущості α можна дізнатися з довідкових таблиць.

приклад

Припустимо, що розмір вибірки становить 25 індивідуальних значень, математичне очікування вибірки дорівнює 50, а середньоквадратичне відхилення вибірки дорівнює 28. Необхідно побудувати довірчий інтервал рівня статистичної значимості α=5%.

У нашому випадку кількість ступенів свободи дорівнює 24 (25-1), отже відповідне табличне значення t-критерію Стьюдента рівня статистичної значимості α=5% становить 2,064. Отже, нижня та верхня межа довірчого інтервалу становитимуть

L = 50 – 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

А сам інтервал може бути записаний у вигляді

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Використання t-розподілу дозволяє звузити довірчий інтервал за рахунок зниження статистичної значимості, або за рахунок збільшення розміру вибірки.

Зменшивши статистичну значущість з 95% до 90% в умовах нашого прикладу, ми отримаємо відповідне табличне значення t-критерію Стьюдента 1,711.

L = 50 – 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

І тут ми можемо стверджувати, що з ймовірністю 90% математичне очікування генеральної сукупності опиниться у діапазоні .

Якщо ми не хочемо знижувати статистичну значущість, то єдиною альтернативою буде збільшення обсягу вибірки. Припустимо, що він становить 64 індивідуальні спостереження, а не 25 як у початковій умові прикладу. Табличне значення t-критерію Стьюдента для 63 ступенів свободи (64-1) та рівня статистичної значущості α=5% становить 1,998.

L = 50 – 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Це дає можливість стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Вибірки великого обсягу

До вибірок великого обсягу відносяться вибірки з генеральної сукупності даних, кількість індивідуальних спостережень у яких перевищує 100. Статистичні дослідження показали, що вибірки більшого обсягу мають тенденцію бути нормально розподіленими, навіть якщо розподіл генеральної сукупності відрізняється від нормального. Крім того, для таких вибірок застосування z-оцінки та t-розподілу дають приблизно однакові результати при побудові довірчих інтервалів. Таким чином, для вибірок великого обсягу допускається застосування z-оцінки для нормального розподілу замість t-розподілу.

Підведемо підсумки