Atviras
Uždaryti

Kaip apskaičiuoti pasikliautinąjį intervalą. Pasitikėjimo intervalai. Taip pat praktinės sigmos vertybės

Sukurkime pasikliautinąjį intervalą programoje MS EXCEL, kad įvertintume vidutinę skirstinio reikšmę žinomos dispersijos vertės atveju.

Žinoma, pasirinkimas pasitikėjimo lygis visiškai priklauso nuo sprendžiamos problemos. Taigi lėktuvo keleivio pasitikėjimo laipsnis lėktuvo patikimumu neabejotinai turėtų būti didesnis nei pirkėjo pasitikėjimo elektros lemputės patikimumu.

Problemos formulavimas

Tarkime, kad nuo gyventojų paimtas mėginys dydis n. Manoma, kad standartinis nuokrypisšis pasiskirstymas žinomas. Remiantis tuo, būtina pavyzdžiaiįvertinti nežinomybę paskirstymo vidurkis(μ, ) ir sukonstruoti atitinkamą dvipusis pasitikėjimo intervalas.

Taško įvertinimas

Kaip žinoma iš statistika(pažymime X vid) yra nešališkas vidurkio įvertinimas tai gyventojų ir turi pasiskirstymą N(μ;σ 2 /n).

Pastaba: Ką daryti, jei reikia statyti pasitikėjimo intervalas paskirstymo atveju tai nėra normalus?Šiuo atveju ateina į pagalbą, kuri teigia, kad su pakankamai dideliu dydžiu pavyzdžiai n nuo paskirstymo nebuvimas normalus, imties statistikos pasiskirstymas X vid valios maždaug atitikti normalus skirstinys su parametrais N(μ;σ 2 /n).

Taigi, taško sąmata vidutinis pasiskirstymo vertės mes turime - tai imties vidurkis, t.y. X vid. Dabar pradėkime pasitikėjimo intervalas.

Pasitikėjimo intervalo sudarymas

Paprastai, žinodami skirstinį ir jo parametrus, galime apskaičiuoti tikimybę, kad atsitiktinis dydis paims reikšmę iš mūsų nurodyto intervalo. Dabar padarykime priešingai: raskite intervalą, kuriame atsitiktinis kintamasis pateks su nurodyta tikimybe. Pavyzdžiui, iš savybių normalus skirstinysžinoma, kad su 95% tikimybe atsitiktinis kintamasis paskirstytas normalus įstatymas, pateks į maždaug +/- 2 diapazoną nuo Vidutinė vertė(žr. straipsnį apie). Šis intervalas mums pasitarnaus kaip prototipas pasitikėjimo intervalas.

Dabar pažiūrėkime, ar žinome paskirstymą , apskaičiuoti šį intervalą? Norėdami atsakyti į klausimą, turime nurodyti skirstinio formą ir jo parametrus.

Mes žinome paskirstymo formą – tai yra normalus skirstinys(atminkite, kad mes kalbame apie mėginių paskirstymas statistika X vid).

Parametras μ mums nežinomas (tik jį reikia įvertinti naudojant pasitikėjimo intervalas), tačiau turime jo įvertinimą X vid. apskaičiuojamas remiantis pavyzdžiai, kuriuos galima naudoti.

Antrasis parametras - imties vidurkio standartinis nuokrypis laikysime žinomu, jis lygus σ/√n.

Nes mes nežinome μ, tada sudarysime intervalą +/- 2 standartiniai nuokrypiai ne iš Vidutinė vertė, ir pagal žinomą įvertinimą X vid. Tie. skaičiuojant pasitikėjimo intervalas mes to negalvosime X vid patenka į +/- 2 diapazoną standartiniai nuokrypiai nuo μ su 95% tikimybe ir manysime, kad intervalas yra +/- 2 standartiniai nuokrypiaiX vid su 95% tikimybe apims μ – visos populiacijos vidurkis, iš kurios paimama mėginys. Šie du teiginiai yra lygiaverčiai, tačiau antrasis teiginys leidžia konstruoti pasitikėjimo intervalas.

Be to, paaiškinkime intervalą: atsitiktinis kintamasis, paskirstytas normalus įstatymas, su 95 % tikimybe patenka į intervalą +/- 1,960 standartiniai nuokrypiai, ne +/- 2 standartiniai nuokrypiai. Tai galima apskaičiuoti naudojant formulę =NORM.ST.REV((1+0.95)/2), cm. pavyzdinis failas Lapo intervalas.

Dabar galime suformuluoti tikimybinį teiginį, kuris mums padės suformuoti pasitikėjimo intervalas:
„Tikimybė, kad gyventojų vidurkis esantis nuo imties vidurkis per 1 960" imties vidurkio standartiniai nuokrypiai", lygus 95 %".

Teiginyje minima tikimybės reikšmė turi specialų pavadinimą , kuris yra susijęs su reikšmingumo lygis α (alfa) paprasta išraiška pasitikėjimo lygis =1 . Mūsų atveju reikšmingumo lygis α =1-0,95=0,05 .

Dabar, remdamiesi šiuo tikimybiniu teiginiu, parašome skaičiavimo išraišką pasitikėjimo intervalas:

kur Z α/2 standartinis normalus skirstinys(ši atsitiktinio dydžio reikšmė z, P(z>=Z α/2 )=α/2).

Pastaba: Viršutinis α/2-kvantilis apibrėžia plotį pasitikėjimo intervalas V standartiniai nuokrypiai imties vidurkis. Viršutinis α/2-kvantilis standartinis normalus skirstinys visada didesnis nei 0, o tai labai patogu.

Mūsų atveju, kai α = 0,05, viršutinis α/2-kvantilis lygus 1.960. Kitiems reikšmingumo lygiams α (10 %; 1 %) viršutinis α/2-kvantilis Z α/2 galima apskaičiuoti naudojant formulę =NORM.ST.REV(1-α/2) arba, jei žinoma pasitikėjimo lygis, =NORM.ST.OBR((1+pasitikėjimo lygis)/2).

Paprastai statant pasikliautinieji intervalai, skirti įvertinti vidurkį naudoti tik viršutinė α/2-kvantilis ir nenaudoti mažesnis α/2-kvantilis. Tai įmanoma, nes standartinis normalus skirstinys simetriškai x ašies atžvilgiu ( jo pasiskirstymo tankis simetriškas apie vidutinis, t.y. 0). Todėl skaičiuoti nereikia apatinis α/2-kvantilis(jis tiesiog vadinamas α /2-kvantilis), nes tai lygu viršutinė α/2-kvantilis su minuso ženklu.

Prisiminkime, kad, nepaisant reikšmės x pasiskirstymo formos, atitinkamas atsitiktinis dydis X vid platinami maždaug gerai N(μ;σ 2 /n) (žr. straipsnį apie). Todėl apskritai aukščiau pateikta išraiška pasitikėjimo intervalas yra tik apytikslis. Jei reikšmė x yra paskirstyta normalus įstatymas N(μ;σ 2 /n), tada išraiška už pasitikėjimo intervalas yra tikslus.

Pasitikėjimo intervalo skaičiavimas MS EXCEL

Išspręskime problemą.
Elektroninio komponento reakcijos į įvesties signalą laikas yra svarbi įrenginio charakteristika. Inžinierius nori sukurti vidutinės atsako trukmės pasikliautinąjį intervalą, kurio patikimumo lygis yra 95%. Iš ankstesnės patirties inžinierius žino, kad atsako laiko standartinis nuokrypis yra 8 ms. Žinoma, kad reakcijos laikui įvertinti inžinierius atliko 25 matavimus, kurių vidutinė vertė buvo 78 ms.

Sprendimas: Inžinierius nori žinoti elektroninio įrenginio reakcijos laiką, bet supranta, kad atsako laikas yra ne fiksuota reikšmė, o atsitiktinis dydis, turintis savo pasiskirstymą. Taigi, geriausia, ko jis gali tikėtis, yra nustatyti šio skirstinio parametrus ir formą.

Deja, iš problemos sąlygų mes nežinome atsako laiko pasiskirstymo formos (tai nebūtinai turi būti normalus). , šis pasiskirstymas taip pat nežinomas. Žinomas tik jis standartinis nuokrypisσ=8. Todėl mes negalime apskaičiuoti tikimybių ir sudaryti pasitikėjimo intervalas.

Tačiau nepaisant to, kad paskirstymo nežinome laikas atskiras atsakymas, mes žinome, kad pagal CPT, mėginių paskirstymas vidutinis reakcijos laikas yra apytiksliai normalus(Manysime, kad sąlygos CPT atliekami, nes dydis pavyzdžiai gana didelis (n=25)) .

Be to, vidutinisšis skirstinys yra lygus Vidutinė vertė vieno atsakymo paskirstymas, t.y. μ. A standartinis nuokrypisšio skirstinio (σ/√n) galima apskaičiuoti naudojant formulę =8/ROOT(25) .

Taip pat žinoma, kad inžinierius gavo taško sąmata parametras μ lygus 78 ms (X avg). Todėl dabar galime apskaičiuoti tikimybes, nes mes žinome paskirstymo formą ( normalus) ir jo parametrus (X avg ir σ/√n).

Inžinierius nori žinoti tikėtina vertėμ atsako laiko skirstiniai. Kaip minėta aukščiau, šis μ yra lygus vidutinės reakcijos trukmės imties pasiskirstymo matematinės lūkesčiai. Jei naudosime normalus skirstinys N(Х avg; σ/√n), tada norimas μ bus diapazone +/-2*σ/√n su maždaug 95 % tikimybe.

Reikšmingumo lygis lygus 1-0,95=0,05.

Galiausiai suraskime kairę ir dešinę kraštą pasitikėjimo intervalas.
Kairė kraštinė: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Dešinė kraštinė: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Kairė kraštinė: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Dešinė kraštinė: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Atsakymas: pasitikėjimo intervalas adresu 95 % patikimumo lygis ir σ=8msek lygus 78+/-3,136 ms.

IN pavyzdinis failas Sigma lapežinoma, sukūrė skaičiavimo ir konstravimo formą dvipusis pasitikėjimo intervalas už savavališką pavyzdžiai su duotu σ ir reikšmingumo lygis.

CONFIDENCE.NORM() funkcija

Jei vertybės pavyzdžiai yra diapazone B20:B79 , A reikšmingumo lygis lygus 0,05; tada MS EXCEL formulė:
=VIDUTINIS(B20:B79)-PASITIKIMAS.NORM(0,05;σ; SKAIČIAVIMAS(B20:B79))
grąžins kairę sieną pasitikėjimo intervalas.

Tą pačią ribą galima apskaičiuoti naudojant formulę:
=VIDUTINIS(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(SKAIČIUS(B20:B79))

Pastaba: Funkcija CONFIDENCE.NORM() pasirodė MS EXCEL 2010. Ankstesnėse MS EXCEL versijose buvo naudojama funkcija TRUST().

Konstantinas Kravčikas aiškiai paaiškina, kas yra pasitikėjimo intervalas atliekant medicininius tyrimus ir kaip jį naudoti

„Katren-Style“ tęsia Konstantino Kravčiko medicinos statistikos serijos leidimą. Dviejuose ankstesniuose straipsniuose autorius nagrinėjo tokių sąvokų kaip ir paaiškinimą.

Konstantinas Kravčikas

Matematikas-analitikas. Medicinos ir humanitarinių mokslų statistinių tyrimų specialistas

Maskvos miestas

Labai dažnai straipsniuose apie klinikinius tyrimus galima rasti paslaptingą frazę: „pasitikėjimo intervalas“ (95 % PI arba 95 % PI – pasikliautinasis intervalas). Pavyzdžiui, straipsnyje gali būti rašoma: „Siekiant įvertinti skirtumų reikšmingumą, Stjudento t testas buvo naudojamas 95 % pasikliautinajam intervalui apskaičiuoti.

Kokia yra „95 % pasikliautinojo intervalo“ reikšmė ir kam ją apskaičiuoti?

Kas yra pasitikėjimo intervalas? - Tai yra diapazonas, kuriame yra tikroji populiacija. Ar yra „netikrų“ vidurkių? Tam tikra prasme taip, jie tai daro. Mes paaiškinome, kad neįmanoma išmatuoti dominančio parametro visoje populiacijoje, todėl mokslininkai tenkina ribotą imtį. Šioje imtyje (pavyzdžiui, remiantis kūno svoriu) yra viena vidutinė reikšmė (tam tikras svoris), pagal kurią sprendžiame apie vidutinę reikšmę visoje populiacijoje. Tačiau mažai tikėtina, kad vidutinis imties (ypač mažos) svoris sutaps su vidutiniu bendrosios populiacijos svoriu. Todėl teisingiau apskaičiuoti ir naudoti vidutinių gyventojų verčių diapazoną.

Pavyzdžiui, įsivaizduokite, kad hemoglobino 95 % pasikliautinasis intervalas (95 % PI) yra 110–122 g/l. Tai reiškia, kad yra 95% tikimybė, kad tikroji vidutinė hemoglobino vertė populiacijoje bus nuo 110 iki 122 g/l. Kitaip tariant, mes nežinome vidutinės hemoglobino reikšmės populiacijoje, tačiau su 95 % tikimybe galime nurodyti šio požymio verčių diapazoną.

Pasitikėjimo intervalai ypač svarbūs skirtumams tarp grupių arba efektų dydžių, kaip jie vadinami.

Tarkime, palyginome dviejų geležies preparatų veiksmingumą: jau seniai rinkoje esančio ir ką tik įregistruoto. Po terapijos kurso įvertinome hemoglobino koncentraciją tirtose pacientų grupėse, o statistinė programa apskaičiavo, kad skirtumas tarp dviejų grupių vidutinių verčių su 95 % tikimybe svyravo nuo 1,72 iki 14,36 g/l (1 lentelė).

Lentelė 1. Nepriklausomų mėginių bandymas
(grupės lyginamos pagal hemoglobino lygį)

Tai turėtų būti aiškinama taip: kai kuriems bendros populiacijos pacientams, vartojantiems naują vaistą, hemoglobinas bus vidutiniškai 1,72–14,36 g/l didesnis nei tiems, kurie vartojo jau žinomą vaistą.

Kitaip tariant, bendroje populiacijoje vidutinių hemoglobino verčių skirtumas tarp grupių yra šiose ribose su 95% tikimybe. Tyrėjas turi nuspręsti, ar tai daug, ar mažai. Viso to esmė ta, kad dirbame ne su viena vidutine reikšme, o su verčių diapazonu, todėl patikimiau įvertiname parametro skirtumą tarp grupių.

Statistiniuose paketuose, tyrėjo nuožiūra, galite savarankiškai susiaurinti arba išplėsti pasikliautinojo intervalo ribas. Sumažindami pasikliautinojo intervalo tikimybes, susiauriname vidurkių diapazoną. Pavyzdžiui, esant 90 % PI, vidurkių diapazonas (arba vidurkių skirtumas) bus siauresnis nei esant 95% PI.

Ir atvirkščiai, padidinus tikimybę iki 99 %, reikšmių diapazonas išplečiamas. Lyginant grupes, apatinė CI riba gali kirsti nulinę ribą. Pavyzdžiui, jei pasikliautinojo intervalo ribas išplėtėme iki 99 %, tai intervalo ribos svyravo nuo –1 iki 16 g/l. Tai reiškia, kad bendroje populiacijoje yra grupių, kurių vidurkių skirtumas tiriamai charakteristikai yra lygus 0 (M = 0).

Naudodami pasikliautinąjį intervalą galite patikrinti statistines hipotezes. Jei pasikliautinasis intervalas kerta nulinę reikšmę, tada nulinė hipotezė, kuri daro prielaidą, kad grupės nesiskiria pagal tiriamą parametrą, yra teisinga. Pavyzdys aprašytas aukščiau, kai išplėtėme ribas iki 99 %. Kai kur bendroje populiacijoje radome grupes, kurios niekuo nesiskyrė.

95 % hemoglobino skirtumo pasikliautinasis intervalas (g/l)


Paveikslėlyje parodytas 95 % pasikliovimo intervalas, skirtas vidutinių hemoglobino verčių skirtumui tarp dviejų grupių. Linija eina per nulio ženklą, todėl yra skirtumas tarp nulio vidurkių, o tai patvirtina nulinę hipotezę, kad grupės nesiskiria. Skirtumas tarp grupių yra nuo –2 iki 5 g/l. Tai reiškia, kad hemoglobino kiekis gali sumažėti 2 g/l arba padidėti 5 g/l.

Pasitikėjimo intervalas yra labai svarbus rodiklis. Jos dėka galite matyti, ar skirtumai grupėse iš tiesų atsirado dėl vidurkių skirtumo, ar dėl didelės imties, nes esant didelei imčiai tikimybė rasti skirtumus yra didesnė nei su maža.

Praktiškai tai gali atrodyti taip. Paėmėme 1000 žmonių mėginį, išmatavome hemoglobino kiekį ir nustatėme, kad vidutinių skirtumų pasikliautinasis intervalas svyravo nuo 1,2 iki 1,5 g/l. Statistinio reikšmingumo lygis šiuo atveju p

Matome, kad hemoglobino koncentracija padidėjo, bet beveik nepastebimai, todėl statistinis reikšmingumas atsirado būtent dėl ​​imties dydžio.

Pasitikėjimo intervalus galima skaičiuoti ne tik pagal priemones, bet ir pagal proporcijas (ir rizikos koeficientus). Pavyzdžiui, mus domina pacientų, kuriems pasireiškė remisija, vartojant sukurtą vaistą, proporcijų pasikliautinasis intervalas. Tarkime, kad 95 % PI proporcijoms, ty tokių pacientų daliai, yra 0,60–0,80 intervale. Taigi galima teigti, kad mūsų vaistas turi gydomąjį poveikį 60–80 % atvejų.

Tikimybės, pripažįstami kaip pakankami, kad būtų galima patikimai įvertinti bendruosius parametrus, remiantis imties charakteristikomis, yra vadinami pasitikintis .

Paprastai kaip patikimumo tikimybės pasirenkamos 0,95 reikšmės; 0,99; 0,999 (jie dažniausiai išreiškiami procentais – 95%, 99%, 99,9%). Kuo didesnis atsakomybės matas, tuo didesnis pasitikėjimo tikimybės lygis: 99% arba 99,9%.

Kūno kultūros ir sporto srities moksliniuose tyrimuose laikomas pakankamas 0,95 (95%) pasitikėjimo lygis.

Vadinamas intervalas, kuriame yra bendrosios visumos imties aritmetinis vidurkis su nurodyta pasikliovimo tikimybe pasitikėjimo intervalas .

Vertinimo reikšmingumo lygis– mažas skaičius α, kurio reikšmė rodo tikimybę, kad jis nepateks už pasikliautinojo intervalo. Pagal pasikliovimo tikimybes: α 1 = (1-0,95) = 0,05; α 2 = (1 – 0,99) = 0,01 ir kt.

Vidurkio pasitikėjimo intervalas (matematinis lūkestis) a normalus skirstinys:

,

kur yra įvertinimo patikimumas (pasitikėjimo tikimybė); - imties vidurkis; s – pataisytas standartinis nuokrypis; n – imties dydis; t γ yra vertė, nustatyta pagal Stjudento pasiskirstymo lentelę (žr. priedą, 1 lentelę) duotiesiems n ir γ.

Norėdami rasti populiacijos vidurkio pasikliautinojo intervalo ribas, turite:

1. Apskaičiuokite ir s.

2. Turėtumėte nustatyti įverčio pasikliovimo lygį (patikimumą) γ į 0,95 (95%) arba reikšmingumo lygį α į 0,05 (5%).

3. Naudodamiesi t-Student pasiskirstymo lentele (priedas, 1 lentelė), raskite ribines reikšmes t γ.

Kadangi t skirstinys yra simetriškas aplink nulinį tašką, pakanka žinoti tik teigiamą t reikšmę. Pavyzdžiui, jei imties dydis yra n=16, tai laisvės laipsnių skaičius df) t– paskirstymai df=16 - 1=15 . Pagal lentelę 1 paraiška t 0,05 = 2,13 .

4. Raskite pasikliautinojo intervalo ribas, kai α = 0,05 ir n = 16:

Pasitikėjimo ribos:

Didelio dydžio mėginiams (n ≥ 30) t – Studento pasiskirstymas tampa normalus. Todėl pasikliautinasis intervalas jei n ≥ 30, galima parašyti taip:

Kur u- normalizuoto normaliojo skirstinio procentiniais punktais.

Standartinėms pasikliovimo tikimybėms (95%, 99%; 99,9%) ir reikšmingumo lygiams α reikšmės ( u) pateikti 8 lentelėje.

8 lentelė

Standartinių pasikliovimo lygių reikšmės α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Remdamiesi 1 pavyzdžio duomenimis, nustatysime ribas 95 proc. pasitikėjimo intervalas (α = 0,05) vidutiniam šuolio stovint rezultatui. Mūsų pavyzdyje imties dydis yra n = 65, tada pasikliautinojo intervalo riboms nustatyti galima naudoti didelio imties dydžio rekomendacijas.

Iš šio straipsnio sužinosite:

    Kas nutiko pasitikėjimo intervalas?

    Kokia prasmė 3 sigmos taisyklės?

    Kaip šias žinias pritaikyti praktikoje?

Šiais laikais dėl informacijos gausos, susijusios su dideliu prekių asortimentu, pardavimo kryptimis, darbuotojais, veiklos sritimis ir kt. gali būti sunku pabrėžti pagrindinį dalyką, į kurią, visų pirma, verta atkreipti dėmesį ir pasistengti suvaldyti. Apibrėžimas pasitikėjimo intervalas ir faktinių verčių, peržengiančių jos ribas, analizė – technika, kuri padės išryškinti situacijas, įtakos besikeičiančioms tendencijoms. Galėsite vystyti teigiamus veiksnius ir sumažinti neigiamų įtaką. Ši technologija naudojama daugelyje žinomų pasaulinių kompanijų.

Yra vadinamųjų " įspėjimai", kuris informuoti vadovus kad kita reikšmė yra tam tikra kryptimi peržengė pasitikėjimo intervalas. Ką tai reiškia? Tai signalas, kad įvyko kažkoks neįprastas įvykis, kuris gali pakeisti esamą tendenciją šia kryptimi. Tai signalas prie to kad išsiaiškinčiau situacijoje ir suprasti, kas tai turėjo įtakos.

Pavyzdžiui, apsvarstykite keletą situacijų. Skaičiavome pardavimų prognozę su prognozuojamomis 100 prekių vienetų limitais 2011 m. mėn. ir faktiniais pardavimais kovo mėnesį:

  1. „Saulėgrąžų aliejaus“ atveju jie peržengė viršutinę prognozės ribą ir nepateko į pasikliautinąjį intervalą.
  2. „Sausosioms mielėms“ viršijome apatinę prognozės ribą.
  3. „Avižinių dribsnių košė“ peržengė viršutinę ribą.

Kitų produktų faktiniai pardavimai neviršijo nurodytų prognozuojamų ribų. Tie. jų pardavimai atitiko lūkesčius. Taigi, mes nustatėme 3 produktus, kurie peržengė sienas, ir pradėjome išsiaiškinti, kas turėjo įtakos jiems išeiti už sienų:

  1. Saulėgrąžų aliejaus platinimo tinkle įžengėme į naują platinimo tinklą, o tai suteikė mums papildomų pardavimų apimčių, todėl peržengėme viršutinę ribą. Šios prekės prognozę verta perskaičiuoti iki metų pabaigos, atsižvelgiant į šio tinklo pardavimų prognozę.
  2. „Sausoms mielėms“ automobilis įstrigo muitinėje, o per 5 dienas atsirado trūkumas, o tai turėjo įtakos pardavimų kritimui ir viršijo apatinę ribą. Galbūt verta išsiaiškinti, kas tai sukėlė, ir pasistengti, kad ši situacija nepasikartotų.
  3. Buvo pradėtas avižinių dribsnių košės pardavimų skatinimo renginys, dėl kurio labai padidėjo pardavimai ir bendrovė viršijo prognozes.

Nustatėme 3 veiksnius, kurie turėjo įtakos prognozių ribų peržengimui. Gyvenime jų gali būti kur kas daugiau, norint padidinti prognozavimo ir planavimo tikslumą – veiksnius, lemiančius, kad realūs pardavimai gali peržengti prognozuojamas ribas, verta išskirti ir kurti prognozes bei planus jiems atskirai. Tada apsvarstykite jų poveikį pagrindinei pardavimo prognozei. Taip pat galite reguliariai įvertinti šių veiksnių poveikį ir pakeisti situaciją į gerąją pusę. mažinant neigiamų ir didinant teigiamų veiksnių įtaką.

Naudodami pasikliautinąjį intervalą galime:

  1. Pasirinkite nuorodas, į kuriuos verta atkreipti dėmesį, nes šiomis kryptimis įvyko įvykių, kurie gali turėti įtakos tendencijos pasikeitimas.
  2. Nustatyti veiksnius, kurios tikrai įtakoja situacijos pasikeitimą.
  3. Priimti informuotas sprendimas(pavyzdžiui, apie pirkimą, planavimą ir pan.).

Dabar pažiūrėkime, kas yra pasikliautinasis intervalas ir kaip jį apskaičiuoti „Excel“ naudojant pavyzdį.

Kas yra pasitikėjimo intervalas?

Pasitikėjimo intervalas – tai prognozės ribos (viršutinė ir apatinė), kurių ribose su nurodyta tikimybe (sigma) bus rodomos tikrosios vertės.

Tie. Mes apskaičiuojame prognozę - tai yra mūsų pagrindinė gairė, tačiau suprantame, kad faktinės vertės greičiausiai nebus 100% lygios mūsų prognozei. Ir kyla klausimas, kokiose ribose faktinės vertės gali kristi, jei išliks dabartinė tendencija? Ir šis klausimas mums padės atsakyti pasikliautinojo intervalo skaičiavimas, t.y. - viršutinė ir apatinė prognozės ribos.

Kas yra nurodytos tikimybės sigma?

Skaičiuojant pasitikėjimo intervalą galime nustatyti tikimybę hitai faktines vertes nurodytose prognozės ribose. Kaip tai padaryti? Norėdami tai padaryti, nustatome sigmos reikšmę ir, jei sigma yra lygi:

    3 sigmos- tada tikimybė, kad kita tikroji reikšmė pateks į pasikliautinąjį intervalą, bus 99,7% arba nuo 300 iki 1, arba yra 0,3% tikimybė peržengti ribas.

    2 sigmos- tada, kitos reikšmės patekimo į ribas tikimybė yra ≈ 95,5%, t.y. tikimybė yra maždaug 20:1 arba yra 4,5% tikimybė, kad peržengsite bortą.

    1 sigma- tada tikimybė yra ≈ 68,3%, t.y. tikimybė yra maždaug nuo 2 iki 1 arba yra 31,7 % tikimybė, kad kita reikšmė iškris už pasikliautinojo intervalo.

Mes suformulavome 3 sigmų taisyklė,kuri tai sako smūgio tikimybė kita atsitiktinė reikšmė į pasitikėjimo intervalą su nurodyta verte trys sigmos yra 99,7 proc..

Didysis rusų matematikas Čebyševas įrodė teoremą, kad yra 10% tikimybė peržengti prognozuojamas ribas, kai nurodyta trijų sigmų vertė. Tie. tikimybė patekti į 3 sigmų pasikliautinąjį intervalą bus mažiausiai 90%, o bandymas apskaičiuoti prognozę ir jos ribas „iš akies“ yra kupinas daug reikšmingesnių klaidų.

Kaip savarankiškai apskaičiuoti pasitikėjimo intervalą „Excel“?

Pažiūrėkime į pasikliautinojo intervalo skaičiavimą programoje Excel (t. y. viršutinę ir apatinę prognozės ribas) naudodami pavyzdį. Turime laiko eilutę – pardavimai pagal mėnesį 5 metus. Žiūrėti pridėtą failą.

Norėdami apskaičiuoti prognozės ribas, apskaičiuojame:

  1. Pardavimų prognozė().
  2. Sigma – standartinis nuokrypis prognoziniai modeliai iš faktinių verčių.
  3. Trys sigmos.
  4. Pasitikėjimo intervalas.

1. Pardavimų prognozė.

=(RC[-14] (laiko eilučių duomenys)– RC[-1] (modelio vertė))^2 (kvadratas)


3. Kiekvienam mėnesiui susumuokite nuokrypių reikšmes nuo 8 etapo Sum((Xi-Ximod)^2), t.y. Apibendrinkime sausį, vasarį... kiekvieniems metams.

Norėdami tai padaryti, naudokite formulę =SUMIF()

SUMIF(masyvas su laikotarpio skaičiais ciklo viduje (mėnesiams nuo 1 iki 12); nuoroda į ciklo laikotarpio numerį; nuoroda į masyvą su skirtumo tarp šaltinio duomenų ir laikotarpio reikšmių kvadratais)


4. Apskaičiuokite standartinį nuokrypį kiekvienam ciklo periodui nuo 1 iki 12 (10 etapas pridedamame faile).

Norėdami tai padaryti, ištraukiame šaknį iš vertės, apskaičiuotos 9 etape ir padalijame iš šio ciklo periodų skaičiaus atėmus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Naudokime Excel formules =ROOT(R8 (nuoroda į (Sum(Xi-Ximod)^2)/(COUNTIF(8 $: 67 $ (nuoroda į masyvą su ciklo numeriais); O8 (nuoroda į konkretų ciklo numerį, kurį skaičiuojame masyve))-1))

Naudojant Excel formulę = COUNTIF suskaičiuojame skaičių n


Apskaičiavę faktinių duomenų standartinį nuokrypį nuo prognozės modelio, gavome kiekvieno mėnesio sigmos reikšmę - 10 etapas pridėtame faile.

3. Apskaičiuokime 3 sigmas.

11 etape nustatome sigmų skaičių - mūsų pavyzdyje „3“ (11 etapas pridedamame faile):

Taip pat patogu praktikuoti sigmos reikšmes:

1,64 sigma – 10% tikimybė viršyti ribą (1 tikimybė iš 10);

1,96 sigma – 5 % tikimybė peržengti ribas (1 galimybė iš 20);

2,6 sigma – 1 % tikimybė viršyti ribas (1 tikimybė iš 100).

5) Trijų sigmų skaičiavimas, tam mes padauginame kiekvieno mėnesio „sigmos“ reikšmes iš „3“.

3. Nustatykite pasikliautinąjį intervalą.

  1. Viršutinė prognozės riba- pardavimų prognozė atsižvelgiant į augimą ir sezoniškumą + (plius) 3 sigmos;
  2. Apatinė prognozės riba- pardavimų prognozė atsižvelgiant į augimą ir sezoniškumą – (minus) 3 sigmos;

Kad būtų patogiau skaičiuoti pasikliautinąjį intervalą ilgam laikotarpiui (žr. pridedamą failą), naudosime Excel formulę =Y8+VLOOKUP(W8,$U$8:$V$19,2,0), Kur

Y8- pardavimų prognozė;

W8- mėnesio, kuriam imsime 3 sigmų reikšmę, skaičius;

Tie. Viršutinė prognozės riba= “pardavimo prognozė” + “3 sigma” (pavyzdyje VLOOKUP(mėnesio skaičius; lentelė su 3 sigmos reikšmėmis; stulpelis, iš kurio išimame sigmos reikšmę, lygią mėnesio skaičiui atitinkamoje eilutėje; 0)).

Apatinė prognozės riba= „pardavimo prognozė“ atėmus „3 sigmos“.

Taigi, mes apskaičiavome pasitikėjimo intervalą „Excel“.

Dabar turime prognozę ir diapazoną su ribomis, per kurias tikrosios vertės pateks su tam tikra sigmos tikimybe.

Šiame straipsnyje apžvelgėme, kas yra sigma ir trijų sigmų taisyklė, kaip nustatyti pasikliautinąjį intervalą ir kodėl galite naudoti šį metodą praktiškai.

Linkime tikslių prognozių ir sėkmės!

Kaip „Forecast4AC PRO“ gali jums padėtiskaičiuojant pasikliautinąjį intervalą?:

    Forecast4AC PRO automatiškai apskaičiuos viršutinę arba apatinę prognozės ribas daugiau nei 1000 laiko eilučių vienu metu;

    Galimybė vienu klavišo paspaudimu analizuoti prognozės ribas, lyginant su prognoze, tendencija ir faktiniais pardavimais diagramoje;

Forcast4AC PRO programoje galima nustatyti sigmos reikšmę nuo 1 iki 3.

Prisijunk prie mūsų!

Atsisiųskite nemokamas prognozavimo ir verslo analizės programas:


  • Novo Forecast Lite- automatinis prognozės skaičiavimas V Excel.
  • 4analytics – ABC-XYZ analizė ir išmetamųjų teršalų analizė Excel.
  • Qlik Sense Darbalaukis ir QlikViewPersonal Edition – BI sistemos, skirtos duomenų analizei ir vizualizavimui.

Išbandykite mokamų sprendimų galimybes:

  • Novo Forecast PRO- didelių duomenų rinkinių prognozavimas Excel programoje.

Pasitikėjimo intervalai ( Anglų Pasitikėjimo intervalai) vienas iš statistikoje naudojamų intervalų įverčių tipų, kurie skaičiuojami tam tikram reikšmingumo lygiui. Jie leidžia teigti, kad tikroji nežinomo statistinio populiacijos parametro reikšmė yra gautame reikšmių diapazone su tikimybe, kurią nurodo pasirinktas statistinio reikšmingumo lygis.

Normalus skirstinys

Kai žinoma duomenų visumos dispersija (σ 2), z balas gali būti naudojamas patikimumo riboms (pasikliautinojo intervalo galutiniams taškams) apskaičiuoti. Palyginti su t pasiskirstymu, naudojant z balą, galėsite sudaryti ne tik siauresnį pasikliautinąjį intervalą, bet ir patikimesnius numatomos vertės bei standartinio nuokrypio (σ) įverčius, nes z balas pagrįstas normalus skirstinys.

Formulė

Pasikliautinojo intervalo ribiniams taškams nustatyti, jei žinomas duomenų visumos standartinis nuokrypis, naudojama ši formulė

L = X - Z α/2 σ
√n

Pavyzdys

Tarkime, kad imties dydis yra 25 stebėjimai, imties laukiama vertė yra 15, o populiacijos standartinis nuokrypis yra 8. Esant reikšmingumo lygiui α=5%, Z balas yra Z α/2 =1,96. Šiuo atveju apatinė ir viršutinė pasikliautinojo intervalo ribos bus

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Taigi galime teigti, kad su 95% tikimybe gyventojų matematinis lūkestis nukris intervale nuo 11,864 iki 18,136.

Pasitikėjimo intervalo susiaurinimo metodai

Tarkime, kad diapazonas yra per platus mūsų tyrimo tikslams. Yra du būdai, kaip sumažinti pasikliautinojo intervalo diapazoną.

  1. Sumažinti statistinio reikšmingumo lygį α.
  2. Padidinkite imties dydį.

Sumažinus statistinio reikšmingumo lygį iki α=10%, gauname Z balą, lygų Z α/2 =1,64. Tokiu atveju bus apatinė ir viršutinė intervalo ribos

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

O pats pasikliautinasis intervalas gali būti parašytas kaip

Šiuo atveju galime daryti prielaidą, kad su 90% tikimybe matematiniai gyventojų lūkesčiai pateks į intervalą .

Jei nenorime sumažinti statistinio reikšmingumo α lygio, tada vienintelė alternatyva yra padidinti imties dydį. Padidinus jį iki 144 stebėjimų, gauname tokias patikimumo ribų vertes

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Pats pasitikėjimo intervalas turės tokią formą

Taigi, susiaurinti pasikliautinąjį intervalą nemažinant statistinio reikšmingumo lygio galima tik padidinus imties dydį. Jei imties dydžio padidinti neįmanoma, pasikliautinąjį intervalą galima susiaurinti tik sumažinus statistinio reikšmingumo lygį.

Pasikliautinio intervalo sudarymas kitokiam nei įprastam skirstiniui

Jei visumos standartinis nuokrypis nežinomas arba skirstinys skiriasi nuo normalaus, pasikliautinajam intervalui sudaryti naudojamas t skirstinys. Šis metodas yra konservatyvesnis, o tai atsispindi platesniuose pasikliautinuosiuose intervaluose, palyginti su technika, pagrįsta Z balu.

Formulė

Norėdami apskaičiuoti apatinę ir viršutinę pasikliautinojo intervalo ribas pagal t pasiskirstymą, naudokite šias formules

L = X - t α σ
√n

Studento skirstinys arba t skirstinys priklauso tik nuo vieno parametro - laisvės laipsnių skaičiaus, kuris yra lygus atskirų požymio reikšmių skaičiui (stebėjimų skaičiui imtyje). Stjudento t-testo reikšmę tam tikram laisvės laipsnių skaičiui (n) ir statistinio reikšmingumo lygį α galima rasti atskaitos lentelėse.

Pavyzdys

Tarkime, kad imties dydis yra 25 atskiros reikšmės, imties laukiama reikšmė yra 50, o imties standartinis nuokrypis yra 28. Būtina sudaryti pasikliautinąjį intervalą statistinio reikšmingumo lygiui α=5%.

Mūsų atveju laisvės laipsnių skaičius yra 24 (25-1), todėl atitinkama Stjudento t-testo lentelė statistinio reikšmingumo lygiui α=5% yra 2,064. Todėl pasikliautinojo intervalo apatinė ir viršutinė ribos bus

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

O pats intervalas gali būti parašytas formoje

Taigi galime teigti, kad su 95% tikimybe matematiniai gyventojų lūkesčiai bus diapazone .

t pasiskirstymas leidžia susiaurinti pasikliautinąjį intervalą sumažinant statistinį reikšmingumą arba padidinant imties dydį.

Sumažinus statistinį reikšmingumą nuo 95% iki 90% mūsų pavyzdžio sąlygomis, gauname atitinkamą Stjudento t-testo lentelės reikšmę 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Šiuo atveju galime teigti, kad su 90% tikimybe matematiniai gyventojų lūkesčiai bus diapazone .

Jei nenorime sumažinti statistinio reikšmingumo, vienintelė alternatyva yra padidinti imties dydį. Tarkime, kad tai yra 64 individualūs stebėjimai, o ne 25, kaip pradinėje pavyzdžio sąlygoje. Stjudento t-testo lentelės reikšmė 63 laisvės laipsniams (64-1) ir statistinio reikšmingumo lygiui α=5% yra 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Tai leidžia teigti, kad su 95% tikimybe matematiniai gyventojų lūkesčiai bus diapazone .

Dideli pavyzdžiai

Didelės imtys – tai imtys iš duomenų visumos, kurioje atskirų stebėjimų skaičius viršija 100. Statistiniai tyrimai parodė, kad didesnės imtys paprastai būna pasiskirstę normaliai, net jei populiacijos pasiskirstymas nėra normalus. Be to, tokiems pavyzdžiams naudojant z balą ir t pasiskirstymą, apskaičiuojant pasikliautinuosius intervalus gaunami maždaug tokie patys rezultatai. Taigi didelėms imtims priimtina naudoti z-balą normaliajam pasiskirstymui, o ne t-skirstymui.

Apibendrinkime