გახსენით
დახურვა

როგორ გამოვთვალოთ ნდობის ინტერვალი. ნდობის ინტერვალები. ასევე პრაქტიკული სიგმას მნიშვნელობები

მოდით ავაშენოთ ნდობის ინტერვალი MS EXCEL-ში, რათა შევაფასოთ განაწილების საშუალო მნიშვნელობა ცნობილი დისპერსიული მნიშვნელობის შემთხვევაში.

რა თქმა უნდა არჩევანი ნდობის დონემთლიანად დამოკიდებულია პრობლემის გადაჭრაზე. ამრიგად, საჰაერო მგზავრის ნდობის ხარისხი თვითმფრინავის საიმედოობაში უდავოდ უნდა იყოს უფრო მაღალი, ვიდრე მყიდველის ნდობის ხარისხი ელექტრო ნათურის სანდოობაში.

Პრობლემის ფორმულირება

დავუშვათ, რომ დან მოსახლეობააღებული ნიმუშიზომა n. ვარაუდობენ, რომ სტანდარტული გადახრაეს განაწილება ცნობილია. ამის საფუძველზე აუცილებელია ნიმუშებიშეაფასეთ უცნობი განაწილების საშუალო(μ, ) და ააგეთ შესაბამისი ორმხრივი ნდობის ინტერვალი.

ქულის შეფასება

როგორც ცნობილია სტატისტიკა(მოდით აღვნიშნოთ X საშ) არის საშუალოს მიუკერძოებელი შეფასებაეს მოსახლეობადა აქვს განაწილება N(μ;σ 2 /n).

შენიშვნა: რა უნდა გააკეთოთ, თუ აშენება გჭირდებათ ნდობის ინტერვალიგანაწილების შემთხვევაში რომ არ არის ნორმალური?ამ შემთხვევაში, მოდის სამაშველო, რომელიც აცხადებს, რომ საკმარისად დიდი ზომის ნიმუშები n განაწილებიდან არ ყოფნა ნორმალური, სტატისტიკის ნიმუშების განაწილება X საშნება დაახლოებითშეესაბამება ნორმალური დისტრიბუცია N(μ;σ 2 /n) პარამეტრებით.

Ისე, ქულების შეფასება საშუალოდ განაწილების ღირებულებებიგვაქვს - ეს ნიმუში ნიშნავს, ე.ი. X საშ. ახლა დავიწყოთ ნდობის ინტერვალი.

ნდობის ინტერვალის აგება

ჩვეულებრივ, განაწილების და მისი პარამეტრების ცოდნით, შეგვიძლია გამოვთვალოთ ალბათობა იმისა, რომ შემთხვევითი ცვლადი მიიღებს მნიშვნელობას ჩვენ მიერ მითითებული ინტერვალიდან. ახლა გავაკეთოთ პირიქით: ვიპოვოთ ინტერვალი, რომელშიც შემთხვევითი ცვლადი დაეცემა მოცემული ალბათობით. მაგალითად, თვისებებიდან ნორმალური დისტრიბუციაცნობილია, რომ 95%-იანი ალბათობით, შემთხვევითი ცვლადი ნაწილდება ნორმალური კანონი, დაეცემა დაახლოებით +/- 2-ის დიაპაზონში საშუალო ღირებულება(იხილეთ სტატია შესახებ). ეს ინტერვალი ჩვენთვის პროტოტიპად გამოდგება ნდობის ინტერვალი.

ახლა ვნახოთ, ვიცით თუ არა განაწილება , ამ ინტერვალის გამოთვლა? კითხვაზე პასუხის გასაცემად უნდა მივუთითოთ განაწილების ფორმა და მისი პარამეტრები.

ჩვენ ვიცით განაწილების ფორმა - ეს არის ნორმალური დისტრიბუცია(გახსოვდეთ, რომ ჩვენ ვსაუბრობთ შერჩევის განაწილება სტატისტიკა X საშ).

პარამეტრი μ უცნობია ჩვენთვის (ის უბრალოდ უნდა შეფასდეს გამოყენებით ნდობის ინტერვალი), მაგრამ ჩვენ გვაქვს ამის შეფასება X საშუალო,გამოითვლება საფუძველზე ნიმუშები,რომლის გამოყენებაც შესაძლებელია.

მეორე პარამეტრი - ნიმუშის საშუალო სტანდარტული გადახრა ჩვენ ცნობად მივიჩნევთ, ის უდრის σ/√n.

იმიტომ რომ ჩვენ არ ვიცით μ, შემდეგ ავაშენებთ ინტერვალს +/- 2 სტანდარტული გადახრებიარა დან საშუალო ღირებულებადა მისი ცნობილი შეფასებით X საშ. იმათ. გაანგარიშებისას ნდობის ინტერვალიჩვენ არ ვივარაუდებთ, რომ X საშშედის +/- 2 დიაპაზონში სტანდარტული გადახრებიμ-დან 95%-იანი ალბათობით და ჩავთვლით, რომ ინტერვალი არის +/- 2 სტანდარტული გადახრებისაწყისი X საშ 95%-იანი ალბათობით დაფარავს μ - საერთო მოსახლეობის საშუალო მაჩვენებელი,საიდანაც არის აღებული ნიმუში. ეს ორი დებულება ექვივალენტურია, მაგრამ მეორე დებულება გვაძლევს აგების საშუალებას ნდობის ინტერვალი.

გარდა ამისა, მოდით დავაზუსტოთ ინტერვალი: შემთხვევითი ცვლადი განაწილებულია ნორმალური კანონი, 95%-იანი ალბათობით +/- 1,960 ინტერვალში მოდის სტანდარტული გადახრები,არა +/- 2 სტანდარტული გადახრები. ეს შეიძლება გამოითვალოს ფორმულის გამოყენებით =NORM.ST.REV((1+0.95)/2), სმ. ფაილის ფურცლის ინტერვალის მაგალითი.

ახლა ჩვენ შეგვიძლია ჩამოვაყალიბოთ ალბათური დებულება, რომელიც გამოგვადგება ნდობის ინტერვალი:
„ალბათობა იმისა მოსახლეობა ნიშნავსმდებარეობა ნიმუშის საშუალო 1960" ფარგლებში ნიმუშის საშუალო სტანდარტული გადახრები", უდრის 95%-ს“.

განცხადებაში მითითებულ ალბათობის მნიშვნელობას აქვს სპეციალური სახელი , რომელიც დაკავშირებულიამნიშვნელოვნების დონე α (ალფა) მარტივი გამოსახულებით ნდობის დონე =1 . ჩვენს შემთხვევაში მნიშვნელობის დონე α =1-0,95=0,05 .

ახლა, ამ ალბათური დებულების საფუძველზე, ჩვენ ვწერთ გამონათქვამს გამოსათვლელად ნდობის ინტერვალი:

სადაც Z α/2 სტანდარტული ნორმალური დისტრიბუცია(შემთხვევითი ცვლადის ეს მნიშვნელობა , Რა (>=Z α/2 )=α/2).

შენიშვნა: ზედა α/2-კვანტილიგანსაზღვრავს სიგანეს ნდობის ინტერვალისტანდარტული გადახრები ნიმუში ნიშნავს. ზედა α/2-კვანტილი სტანდარტული ნორმალური დისტრიბუციაყოველთვის 0-ზე მეტი, რაც ძალიან მოსახერხებელია.

ჩვენს შემთხვევაში, α=0.05, ზედა α/2-კვანტილი უდრის 1.960. სხვა მნიშვნელოვნების დონეებისთვის α (10%; 1%) ზედა α/2-კვანტილი Z α/2 შეიძლება გამოითვალოს ფორმულის გამოყენებით =NORM.ST.REV(1-α/2) ან, თუ ცნობილია ნდობის დონე, =NORM.ST.OBR((1+ნდობის დონე)/2).

ჩვეულებრივ აშენებისას ნდობის ინტერვალები საშუალოს შესაფასებლადგამოიყენეთ მხოლოდ ზედა α/2-კვანტილიდა არ გამოიყენოთ ქვედა α/2-კვანტილი. ეს შესაძლებელია იმიტომ სტანდარტული ნორმალური დისტრიბუციასიმეტრიულად x ღერძის მიმართ ( მისი განაწილების სიმკვრივესიმეტრიული შესახებ საშუალოდ, ე.ი. 0). ამიტომ, არ არის საჭირო გამოთვლა ქვედა α/2-კვანტილი(მას უბრალოდ α /2-კვანტილი), რადგან ის თანაბარია ზედა α/2-კვანტილიმინუს ნიშნით.

შეგახსენებთ, რომ x მნიშვნელობის განაწილების ფორმის მიუხედავად, შესაბამისი შემთხვევითი ცვლადი X საშგანაწილებული დაახლოებით ჯარიმა N(μ;σ 2 /n) (იხილეთ სტატია შესახებ). ამიტომ, ზოგადად, ზემოაღნიშნული გამოთქმა ნდობის ინტერვალიმხოლოდ მიახლოებაა. თუ x მნიშვნელობა ნაწილდება ნორმალური კანონი N(μ;σ 2 /n), შემდეგ გამოთქმა for ნდობის ინტერვალიზუსტია.

ნდობის ინტერვალის გაანგარიშება MS EXCEL-ში

მოვაგვაროთ პრობლემა.
ელექტრონული კომპონენტის რეაგირების დრო შეყვანის სიგნალზე არის მოწყობილობის მნიშვნელოვანი მახასიათებელი. ინჟინერს სურს შექმნას ნდობის ინტერვალი საშუალო რეაგირების დროისთვის ნდობის დონეზე 95%. წინა გამოცდილებიდან ინჟინერმა იცის, რომ რეაგირების დროის სტანდარტული გადახრა არის 8 ms. ცნობილია, რომ რეაგირების დროის შესაფასებლად ინჟინერმა გააკეთა 25 გაზომვა, საშუალო მნიშვნელობა იყო 78 ms.

გამოსავალი: ინჟინერს სურს იცოდეს ელექტრონული მოწყობილობის რეაგირების დრო, მაგრამ მას ესმის, რომ რეაგირების დრო არ არის ფიქსირებული მნიშვნელობა, არამედ შემთხვევითი ცვლადი, რომელსაც აქვს საკუთარი განაწილება. ასე რომ, საუკეთესო, რისი იმედიც მას შეუძლია, არის ამ განაწილების პარამეტრებისა და ფორმის განსაზღვრა.

სამწუხაროდ, პრობლემის პირობებიდან გამომდინარე, ჩვენ არ ვიცით რეაგირების დროის განაწილების ფორმა (ეს არ არის აუცილებელი ნორმალური). , ეს განაწილება ასევე უცნობია. მხოლოდ ის არის ცნობილი სტანდარტული გადახრაσ=8. ამიტომ, ჩვენ არ შეგვიძლია გამოვთვალოთ ალბათობა და კონსტრუქცია ნდობის ინტერვალი.

თუმცა, მიუხედავად იმისა, რომ განაწილება არ ვიცით დრო ცალკე პასუხი, ამის მიხედვით ვიცით CPT, შერჩევის განაწილება საშუალო პასუხის დროარის დაახლოებით ნორმალური(ჩვენ ვივარაუდებთ, რომ პირობები CPTტარდება, რადგან ზომა ნიმუშებისაკმაოდ დიდი (n=25)) .

უფრო მეტიც, საშუალოდეს განაწილება უდრის საშუალო ღირებულებაერთი პასუხის განაწილება, ე.ი. μ. ა სტანდარტული გადახრაამ განაწილების (σ/√n) შეიძლება გამოითვალოს ფორმულით =8/ROOT(25) .

ასევე ცნობილია, რომ ინჟინერმა მიიღო ქულების შეფასებაპარამეტრი μ უდრის 78 ms (X საშუალო). ამიტომ, ახლა ჩვენ შეგვიძლია გამოვთვალოთ ალბათობა, რადგან ჩვენ ვიცით განაწილების ფორმა ( ნორმალური) და მისი პარამეტრები (X avg და σ/√n).

ინჟინერს სურს იცოდეს მოსალოდნელი ღირებულებაμ რეაგირების დროის განაწილება. როგორც ზემოთ აღინიშნა, ეს μ უდრის საშუალო პასუხის დროის ნიმუშის განაწილების მათემატიკური მოლოდინი. თუ ვიყენებთ ნორმალური დისტრიბუცია N(X საშუალო; σ/√n), მაშინ სასურველი μ იქნება +/-2*σ/√n დიაპაზონში, დაახლოებით 95%-ის ალბათობით.

მნიშვნელობის დონეუდრის 1-0,95=0,05.

დაბოლოს, ვიპოვოთ მარცხენა და მარჯვენა საზღვარი ნდობის ინტერვალი.
მარცხენა საზღვარი: =78-NORM.ST.INV(1-0.05/2)*8/ROOT(25) = 74,864
მარჯვენა საზღვარი: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

მარცხენა საზღვარი: =NORM.REV(0.05/2; 78; 8/ROOT(25))
მარჯვენა საზღვარი: =NORM.REV(1-0.05/2; 78; 8/ROOT(25))

უპასუხე: ნდობის ინტერვალიზე 95% ნდობის დონე და σ=8msecუდრის 78+/-3.136 ms.

IN ფაილის მაგალითი სიგმა ფურცელზეცნობილია, შექმნა გაანგარიშებისა და კონსტრუქციის ფორმა ორმხრივი ნდობის ინტერვალითვითნებობისთვის ნიმუშებიმოცემული σ და მნიშვნელობის დონე.

CONFIDENCE.NORM() ფუნქცია

თუ ღირებულებები ნიმუშებიდიაპაზონში არიან B20: B79 , ა მნიშვნელობის დონე 0,05-ის ტოლია; შემდეგ MS EXCEL ფორმულა:
=AVERAGE(B20:B79)-CONFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
დააბრუნებს მარცხენა საზღვარს ნდობის ინტერვალი.

იგივე ლიმიტი შეიძლება გამოითვალოს ფორმულის გამოყენებით:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

შენიშვნა: CONFIDENCE.NORM() ფუნქცია გამოჩნდა MS EXCEL 2010-ში. MS EXCEL-ის ადრინდელ ვერსიებში გამოიყენებოდა TRUST() ფუნქცია.

კონსტანტინე კრავჩიკი ნათლად განმარტავს, რა არის ნდობის ინტერვალი სამედიცინო კვლევაში და როგორ გამოვიყენოთ იგი

„კატრენ-სტილი“ აგრძელებს კონსტანტინე კრავჩიკის სამედიცინო სტატისტიკის სერიის გამოცემას. ორ წინა სტატიაში ავტორი შეეხო ისეთი ცნებების ახსნას, როგორიცაა და.

კონსტანტინე კრავჩიკი

მათემატიკოს-ანალიტიკოსი. მედიცინასა და ჰუმანიტარულ მეცნიერებებში სტატისტიკური კვლევების სპეციალისტი

ქალაქი მოსკოვი

ძალიან ხშირად კლინიკურ კვლევებზე სტატიებში შეგიძლიათ იპოვოთ იდუმალი ფრაზა: „ნდობის ინტერვალი“ (95 % CI ან 95 % CI - ნდობის ინტერვალი). მაგალითად, სტატიაში შეიძლება დაწეროს: „განსხვავებების მნიშვნელოვნების შესაფასებლად გამოყენებული იქნა სტუდენტის t-ტესტი 95 % ნდობის ინტერვალის გამოსათვლელად“.

რა არის „95 % ნდობის ინტერვალის“ მნიშვნელობა და რატომ გამოვთვალოთ იგი?

რა არის ნდობის ინტერვალი? - ეს ის დიაპაზონია, რომლის ფარგლებშიც ნამდვილი პოპულაცია ტყუილს ნიშნავს. არის თუ არა "არაჭეშმარიტი" საშუალო მაჩვენებლები? გარკვეული გაგებით, დიახ, აკეთებენ. ჩვენ განვმარტეთ, რომ შეუძლებელია მთელი პოპულაციის ინტერესის პარამეტრის გაზომვა, ამიტომ მკვლევარები კმაყოფილნი არიან შეზღუდული ნიმუშით. ამ ნიმუშში (მაგალითად, სხეულის წონის მიხედვით) არის ერთი საშუალო მნიშვნელობა (გარკვეული წონა), რომლითაც ჩვენ ვიმსჯელებთ საშუალო მნიშვნელობაზე მთელ პოპულაციაში. თუმცა, ნაკლებად სავარაუდოა, რომ ნიმუშის (განსაკუთრებით მცირე) საშუალო წონა საერთო პოპულაციის საშუალო წონას ემთხვევა. აქედან გამომდინარე, უფრო სწორია მოსახლეობის საშუალო მნიშვნელობების დიაპაზონის გამოთვლა და გამოყენება.

მაგალითად, წარმოიდგინეთ, რომ ჰემოგლობინის 95% ნდობის ინტერვალი (95% CI) არის 110-დან 122 გ/ლ-მდე. ეს ნიშნავს, რომ არსებობს 95%-იანი შანსი იმისა, რომ პოპულაციაში ჰემოგლობინის ნამდვილი საშუალო მნიშვნელობა იყოს 110-დან 122 გ/ლ-მდე. სხვა სიტყვებით რომ ვთქვათ, ჩვენ არ ვიცით პოპულაციაში ჰემოგლობინის საშუალო მნიშვნელობა, მაგრამ შეგვიძლია, 95 % ალბათობით, მივუთითოთ ამ მახასიათებლის მნიშვნელობების დიაპაზონი.

ნდობის ინტერვალები განსაკუთრებით აქტუალურია ჯგუფებს შორის საშუალებებში განსხვავებულობისთვის, ან ეფექტის ზომის, როგორც მათ უწოდებენ.

ვთქვათ, შევადარეთ რკინის ორი პრეპარატის ეფექტურობა: ერთი, რომელიც დიდი ხანია ბაზარზეა და ერთი, რომელიც ახლახან დარეგისტრირდა. თერაპიის კურსის შემდეგ ჩვენ შევაფასეთ ჰემოგლობინის კონცენტრაცია პაციენტთა შესწავლილ ჯგუფებში და სტატისტიკურმა პროგრამამ გამოთვალა, რომ განსხვავება ორი ჯგუფის საშუალო მნიშვნელობებს შორის იყო, 95 % ალბათობით, 1,72-დან დიაპაზონში. 14,36 გ/ლ (ცხრილი 1).

მაგიდა 1. ტესტი დამოუკიდებელი ნიმუშებისთვის
(ჯგუფები შედარებულია ჰემოგლობინის დონის მიხედვით)

ეს უნდა იქნას განმარტებული შემდეგნაირად: ზოგადი პოპულაციის ზოგიერთ პაციენტში, რომლებიც იღებენ ახალ პრეპარატს, ჰემოგლობინი საშუალოდ უფრო მაღალი იქნება 1,72-14,36 გ/ლ-ით, ვიდრე მათში, ვინც იღებდა უკვე ცნობილ პრეპარატს.

სხვა სიტყვებით რომ ვთქვათ, ზოგად პოპულაციაში, ჯგუფებს შორის ჰემოგლობინის საშუალო მნიშვნელობების სხვაობა ამ საზღვრებშია 95% ალბათობით. მკვლევარის გადასაწყვეტი იქნება, ეს ბევრია თუ ცოტა. ამ ყველაფრის აზრი ის არის, რომ ჩვენ ვმუშაობთ არა ერთი საშუალო მნიშვნელობით, არამედ მნიშვნელობების დიაპაზონით, ამიტომ უფრო საიმედოდ ვაფასებთ განსხვავებას პარამეტრებში ჯგუფებს შორის.

სტატისტიკურ პაკეტებში, მკვლევარის შეხედულებისამებრ, შეგიძლიათ დამოუკიდებლად შეზღუდოთ ან გააფართოვოთ ნდობის ინტერვალის საზღვრები. ნდობის ინტერვალის ალბათობების შემცირებით, ჩვენ ვიწროვებთ საშუალებების დიაპაზონს. მაგალითად, 90 % CI-ზე საშუალო დიაპაზონი (ან საშუალო განსხვავება) უფრო ვიწრო იქნება ვიდრე 95 %.

პირიქით, ალბათობის გაზრდა 99 %-მდე აფართოებს მნიშვნელობების დიაპაზონს. ჯგუფების შედარებისას CI-ის ქვედა ზღვარი შეიძლება გადალახოს ნულოვანი ნიშნულს. მაგალითად, თუ ჩვენ გავაფართოვეთ ნდობის ინტერვალის საზღვრები 99 %-მდე, მაშინ ინტერვალის საზღვრები მერყეობდა –1-დან 16 გ/ლ-მდე. ეს ნიშნავს, რომ ზოგად პოპულაციაში არის ჯგუფები, რომელთა საშუალებებს შორის განსხვავება შესწავლილი მახასიათებლისთვის უდრის 0-ს (M = 0).

ნდობის ინტერვალის გამოყენებით, შეგიძლიათ შეამოწმოთ სტატისტიკური ჰიპოთეზები. თუ ნდობის ინტერვალი კვეთს ნულოვან მნიშვნელობას, მაშინ ნულოვანი ჰიპოთეზა, რომელიც ვარაუდობს, რომ ჯგუფები არ განსხვავდებიან შესასწავლ პარამეტრზე, მართალია. მაგალითი ზემოთ აღწერილია, სადაც ჩვენ გავაფართოვეთ საზღვრები 99 %-მდე. სადღაც საერთო პოპულაციაში აღმოვაჩინეთ ჯგუფები, რომლებიც არანაირად არ განსხვავდებოდნენ.

ჰემოგლობინის სხვაობის 95% ნდობის ინტერვალი, (გ/ლ)


ფიგურა გვიჩვენებს 95% ნდობის ინტერვალს ორ ჯგუფს შორის ჰემოგლობინის საშუალო მნიშვნელობების სხვაობისთვის. ხაზი გადის ნულოვან ნიშნულზე, შესაბამისად არის განსხვავება ნულის საშუალებებს შორის, რაც ადასტურებს ნულოვანი ჰიპოთეზას, რომ ჯგუფები არ განსხვავდებიან. ჯგუფებს შორის განსხვავების დიაპაზონი არის -2-დან 5 გ/ლ-მდე, ეს ნიშნავს, რომ ჰემოგლობინი შეიძლება შემცირდეს 2 გ/ლ-ით ან გაიზარდოს 5 გ/ლ-ით.

ნდობის ინტერვალი ძალიან მნიშვნელოვანი მაჩვენებელია. მისი წყალობით, თქვენ ხედავთ, ჯგუფებში განსხვავებები მართლაც იყო საშუალებებში განსხვავებულობით თუ დიდი ნიმუშის გამო, რადგან დიდი ნიმუშით განსხვავებების პოვნის შანსი უფრო დიდია, ვიდრე მცირეზე.

პრაქტიკაში შეიძლება ასე გამოიყურებოდეს. ჩვენ ავიღეთ 1000 ადამიანის ნიმუში, გავზომეთ ჰემოგლობინის დონე და აღმოვაჩინეთ, რომ საშუალებებში სხვაობის ნდობის ინტერვალი მერყეობდა 1,2-დან 1,5 გ/ლ-მდე. სტატისტიკური მნიშვნელოვნების დონე ამ შემთხვევაში გვ

ჩვენ ვხედავთ, რომ ჰემოგლობინის კონცენტრაცია გაიზარდა, მაგრამ თითქმის შეუმჩნევლად, მაშასადამე, სტატისტიკური მნიშვნელობა სწორედ ნიმუშის ზომის გამო გამოჩნდა.

ნდობის ინტერვალები შეიძლება გამოითვალოს არა მხოლოდ საშუალებებზე, არამედ პროპორციებზე (და რისკის კოეფიციენტებზე). მაგალითად, ჩვენ გვაინტერესებს იმ პაციენტების პროპორციების ნდობის ინტერვალი, რომლებმაც მიაღწიეს რემისიას განვითარებული პრეპარატის მიღებისას. დავუშვათ, რომ 95 % CI პროპორციებისთვის, ანუ ასეთი პაციენტების პროპორციისთვის, არის 0,60-0,80 დიაპაზონში. ამრიგად, შეგვიძლია ვთქვათ, რომ ჩვენს წამალს აქვს თერაპიული ეფექტი შემთხვევების 60-დან 80 %-მდე.

ალბათობები, აღიარებული, როგორც საკმარისი იმისათვის, რომ დამაჯერებლად განვსაჯოთ ზოგადი პარამეტრები ნიმუშის მახასიათებლების საფუძველზე, ეწოდება სანდო .

როგორც წესი, 0,95 მნიშვნელობები არჩეულია როგორც ნდობის ალბათობა; 0,99; 0,999 (ისინი ჩვეულებრივ გამოხატულია პროცენტულად - 95%, 99%, 99,9%). რაც უფრო მაღალია პასუხისმგებლობის ზომა, მით უფრო მაღალია ნდობის ალბათობა: 99% ან 99,9%.

ფიზიკური აღზრდისა და სპორტის სფეროში სამეცნიერო კვლევებში საკმარისად ითვლება ნდობის დონე 0,95 (95%).

შუალედი, რომელშიც საერთო პოპულაციის არითმეტიკული საშუალო ნიმუში მოცემულია მოცემული ნდობის ალბათობით, ე.წ. ნდობის ინტერვალი .

შეფასების მნიშვნელოვნების დონე- მცირე რიცხვი α, რომლის მნიშვნელობა ვარაუდობს იმის ალბათობას, რომ ის სცილდება ნდობის ინტერვალს. ნდობის ალბათობების შესაბამისად: α 1 = (1-0,95) = 0,05; α 2 = (1 – 0,99) = 0,01 და ა.შ.

ნდობის ინტერვალი საშუალოსთვის (მათემატიკური მოლოდინი) ნორმალური დისტრიბუცია:

,

სად არის შეფასების სანდოობა (ნდობის ალბათობა); - ნიმუში საშუალო; s - შესწორებული სტანდარტული გადახრა; n – ნიმუშის ზომა; t γ არის მნიშვნელობა, რომელიც განისაზღვრება Student განაწილების ცხრილიდან (იხ. დანართი, ცხრილი 1) მოცემული n და γ-სთვის.

პოპულაციის საშუალო სანდოობის ინტერვალის საზღვრების მოსაძებნად საჭიროა:

1. გამოთვალეთ და ს.

2. თქვენ უნდა დააყენოთ შეფასების ნდობის დონე (სანდოობა) γ 0,95 (95%) ან α მნიშვნელოვნების დონე 0,05 (5%).

3. t-Student განაწილების ცხრილის გამოყენებით (დანართი, ცხრილი 1), იპოვეთ სასაზღვრო მნიშვნელობები t γ.

ვინაიდან t განაწილება სიმეტრიულია ნულოვანი წერტილის გარშემო, საკმარისია ვიცოდეთ t-ის მხოლოდ დადებითი მნიშვნელობა. მაგალითად, თუ ნიმუშის ზომაა n=16, მაშინ თავისუფლების გრადუსების რაოდენობა დფ) - დისტრიბუციები დფ=16 - 1=15 . ცხრილის მიხედვით 1 განაცხადი t 0.05 = 2.13 .

4. იპოვეთ ნდობის ინტერვალის ზღვრები α = 0,05 და n = 16:

ნდობის საზღვრები:

ნიმუშის დიდი ზომისთვის (n≥ 30) t – სტუდენტური განაწილება ნორმალური ხდება. ამიტომ, ნდობის ინტერვალი ამისთვის n ≥ 30-ისთვის შეიძლება ჩაიწეროს შემდეგნაირად:

სად u- ნორმალიზებული ნორმალური განაწილების პროცენტული პუნქტები.

სტანდარტული ნდობის ალბათობებისთვის (95%, 99%; 99.9%) და მნიშვნელოვნების დონის α მნიშვნელობებისთვის ( u) მოცემულია ცხრილში 8.

ცხრილი 8

მნიშვნელობები სტანდარტული ნდობის დონეებისთვის α

α u
0,05 1,96
0,01 2,58
0,001 3,28

1-ლი მაგალითის მონაცემებზე დაყრდნობით, ჩვენ განვსაზღვრავთ 95%-ის საზღვრებს ნდობის ინტერვალი (α = 0,05) საშუალოდ მდგომი ნახტომის შედეგისთვის.ჩვენს მაგალითში, ნიმუშის ზომაა n = 65, მაშინ რეკომენდაციები დიდი ნიმუშის ზომის შესახებ შეიძლება გამოყენებულ იქნას სანდო ინტერვალის საზღვრების დასადგენად.

ამ სტატიიდან გაიგებთ:

    Რა მოხდა ნდობის ინტერვალი?

    რა აზრი აქვს 3 სიგმას წესები?

    როგორ შეგიძლიათ გამოიყენოთ ეს ცოდნა პრაქტიკაში?

დღესდღეობით, ინფორმაციის სიმრავლის გამო, რომელიც დაკავშირებულია პროდუქციის დიდ ასორტიმენტთან, გაყიდვების მიმართულებებთან, თანამშრომლებთან, საქმიანობის სფეროებთან და ა.შ. შეიძლება რთული იყოს მთავარის ხაზგასმა, რომლის მართვაზე, პირველ რიგში, ღირს ყურადღების მიქცევა და ძალისხმევა. განმარტება ნდობის ინტერვალიდა ფაქტობრივი ფასეულობების ანალიზი, რომელიც სცილდება მის საზღვრებს - ტექნიკა, რომელიც დაგეხმარებათ სიტუაციების გამოყოფაში, გავლენას ახდენს ცვალებად ტენდენციებზე.თქვენ შეძლებთ პოზიტიური ფაქტორების განვითარებას და უარყოფითი ფაქტორების გავლენის შემცირებას. ეს ტექნოლოგია გამოიყენება ბევრ ცნობილ გლობალურ კომპანიაში.

არსებობს ე.წ. გაფრთხილებები", რომელიც აცნობეთ მენეჯერებსრომ შემდეგი მნიშვნელობა არის გარკვეული მიმართულებით გასცდა ნდობის ინტერვალი. Რას ნიშნავს ეს? ეს არის სიგნალი იმისა, რომ მოხდა რაღაც უჩვეულო მოვლენა, რამაც შესაძლოა შეცვალოს არსებული ტენდენცია ამ მიმართულებით. ეს არის სიგნალირომ რომ გაერკვიასიტუაციაში და იმის გაგება, თუ რა მოახდინა მასზე გავლენა.

მაგალითად, განიხილეთ რამდენიმე სიტუაცია. ჩვენ გამოვთვალეთ გაყიდვების პროგნოზი პროგნოზის ლიმიტებით 2011 წლის 100 პროდუქტის ერთეულზე თვეების მიხედვით და მარტში რეალური გაყიდვები:

  1. „მზესუმზირის ზეთისთვის“ მათ გაარღვიეს პროგნოზის ზედა ზღვარი და არ მოხვდნენ ნდობის ინტერვალში.
  2. „მშრალ საფუარზე“ ჩვენ გადავაჭარბეთ პროგნოზის ქვედა ზღვარს.
  3. „შვრიის ფაფამ“ ზედა ზღვარი გაარღვია.

სხვა პროდუქტებისთვის, ფაქტობრივი გაყიდვები იყო მოცემული პროგნოზის ფარგლებში. იმათ. მათი გაყიდვები მოლოდინის ფარგლებში იყო. ასე რომ, ჩვენ გამოვავლინეთ 3 პროდუქტი, რომელიც გასცდა საზღვრებს და დავიწყეთ იმის გარკვევა, თუ რა იმოქმედა მათ საზღვრებს მიღმა:

  1. მზესუმზირის ზეთისთვის ჩვენ შევედით ახალ სადისტრიბუციო ქსელში, რამაც მოგვცა გაყიდვების დამატებითი მოცულობა, რამაც განაპირობა ჩვენ გადავედით ზედა ზღვარზე. ამ პროდუქტისთვის ღირს პროგნოზის გადათვლა წლის ბოლომდე, ამ ქსელის გაყიდვების პროგნოზის გათვალისწინებით.
  2. „მშრალ საფუარზე“ მანქანა საბაჟოზე გაიჭედა და 5 დღეში დეფიციტი იყო, რამაც გაყიდვების შემცირებაზე იმოქმედა და ქვედა ზღვარს გადააჭარბა. შეიძლება ღირდეს იმის გარკვევა, თუ რამ გამოიწვია ეს და ეცადოთ არ განმეორდეს ეს სიტუაცია.
  3. შვრიის ფაფისთვის გაყიდვების ხელშეწყობის ღონისძიება დაიწყო, რამაც გაყიდვების მნიშვნელოვანი ზრდა გამოიწვია და კომპანიამ პროგნოზის მიღმა გასვლა გამოიწვია.

ჩვენ გამოვავლინეთ 3 ფაქტორი, რომელმაც გავლენა მოახდინა პროგნოზის ლიმიტების მიღმა. მათ ცხოვრებაში ბევრად მეტი შეიძლება იყოს პროგნოზირებისა და დაგეგმვის სიზუსტის გასაზრდელად, ფაქტორები, რომლებიც იწვევს იმ ფაქტს, რომ რეალური გაყიდვები შეიძლება გასცდეს პროგნოზს, ღირს ცალკე გამოვყოთ და შევქმნათ პროგნოზები და გეგმები. და შემდეგ განიხილეთ მათი გავლენა გაყიდვების მთავარ პროგნოზზე. თქვენ ასევე შეგიძლიათ რეგულარულად შეაფასოთ ამ ფაქტორების გავლენა და შეცვალოთ სიტუაცია უკეთესობისკენ. უარყოფითი ფაქტორების გავლენის შემცირებით და პოზიტიური ფაქტორების გავლენის გაზრდით.

ნდობის ინტერვალით ჩვენ შეგვიძლია:

  1. აირჩიეთ მიმართულებები, რომლებზეც ყურადღების მიქცევა ღირს, რადგან მოვლენები მოხდა ამ მიმართულებით, რამაც შეიძლება გავლენა მოახდინოს ტენდენციის ცვლილება.
  2. ფაქტორების იდენტიფიცირება, რაც ნამდვილად ახდენს გავლენას სიტუაციის ცვლილებაზე.
  3. მიღება ინფორმირებული გადაწყვეტილება(მაგალითად, შესყიდვის, დაგეგმვის და ა.შ.) შესახებ.

ახლა მოდით შევხედოთ რა არის ნდობის ინტერვალი და როგორ გამოვთვალოთ იგი Excel-ში მაგალითის გამოყენებით.

რა არის ნდობის ინტერვალი?

ნდობის ინტერვალი არის საპროგნოზო საზღვრები (ზედა და ქვედა), რომლის ფარგლებშიც მოცემული ალბათობით (სიგმა)გამოჩნდება რეალური მნიშვნელობები.

იმათ. ჩვენ ვიანგარიშებთ პროგნოზს - ეს არის ჩვენი მთავარი სახელმძღვანელო, მაგრამ გვესმის, რომ რეალური მნიშვნელობები ნაკლებად სავარაუდოა, რომ იყოს 100% ჩვენი პროგნოზის ტოლი. და ჩნდება კითხვა, რა საზღვრებშირეალური მნიშვნელობები შეიძლება დაეცეს, თუ მიმდინარე ტენდენცია გაგრძელდება? და ეს კითხვა დაგვეხმარება პასუხის გაცემაში ნდობის ინტერვალის გაანგარიშება, ე.ი. - პროგნოზის ზედა და ქვედა ზღვარი.

რა არის მოცემული ალბათობის სიგმა?

გაანგარიშებისასნდობის ინტერვალი შეგვიძლია დააყენეთ ალბათობა ჰიტებიფაქტობრივი ღირებულებები მოცემული პროგნოზის ფარგლებში. Როგორ გავაკეთო ეს? ამისათვის ჩვენ ვაყენებთ სიგმის მნიშვნელობას და, თუ სიგმა უდრის:

    3 სიგმა- მაშინ, შემდეგი ფაქტობრივი მნიშვნელობის ნდობის ინტერვალში მოხვედრის ალბათობა იქნება 99,7%, ანუ 300-დან 1-მდე, ან არის 0,3% ალბათობა, რომ გადავიდეს საზღვრებს მიღმა.

    2 სიგმა- მაშინ, მომდევნო მნიშვნელობის საზღვრებში მოხვედრის ალბათობა არის ≈ 95,5%, ე.ი. შანსები დაახლოებით 20-დან 1-მდეა, ან არის 4.5% შანსი, რომ გადალახოთ ზღვარი.

    1 სიგმა- მაშინ ალბათობა არის ≈ 68,3%, ე.ი. შანსები არის დაახლოებით 2-დან 1-მდე, ან არის 31.7% შანსი, რომ შემდეგი მნიშვნელობა ნდობის ინტერვალის მიღმა აღმოჩნდეს.

ჩამოვაყალიბეთ 3 სიგმას წესი,რომელიც ამბობს რომ დარტყმის ალბათობაკიდევ ერთი შემთხვევითი მნიშვნელობა ნდობის ინტერვალშიმოცემული ღირებულებით სამი სიგმა არის 99.7%.

დიდმა რუსმა მათემატიკოსმა ჩებიშევმა დაამტკიცა თეორემა, რომ არსებობს 10%-იანი ალბათობა პროგნოზის ზღვრების მიღმა სამი სიგმის მოცემული მნიშვნელობით. იმათ. 3-სიგმას ნდობის ინტერვალში მოხვედრის ალბათობა იქნება მინიმუმ 90%, ხოლო პროგნოზისა და მისი საზღვრების „თვალით“ გამოთვლის მცდელობა სავსეა ბევრად უფრო მნიშვნელოვანი შეცდომებით.

როგორ გამოვთვალოთ ნდობის ინტერვალი საკუთარ თავს Excel-ში?

მოდით შევხედოთ Excel-ში ნდობის ინტერვალის გაანგარიშებას (ანუ პროგნოზის ზედა და ქვედა ზღვრები) მაგალითის გამოყენებით. გვაქვს დროის სერია - გაყიდვები თვეების მიხედვით 5 წლის განმავლობაში. Იხილეთ თანდართული ფაილი.

პროგნოზის ლიმიტების გამოსათვლელად, ჩვენ ვიანგარიშებთ:

  1. Გაყიდვების პროგნოზი().
  2. სიგმა - სტანდარტული გადახრასაპროგნოზო მოდელები რეალური მნიშვნელობებიდან.
  3. სამი სიგმა.
  4. Ნდობის ინტერვალი.

1. გაყიდვების პროგნოზი.

=(RC[-14] (დროის სერიების მონაცემები)- RC[-1] (მოდელის ღირებულება))^2 (კვადრატში)


3. ყოველი თვისთვის შევაჯამოთ გადახრის მნიშვნელობები მე-8 ეტაპიდან Sum((Xi-Ximod)^2), ე.ი. შევაჯამოთ იანვარი, თებერვალი... ყოველი წლისთვის.

ამისათვის გამოიყენეთ ფორმულა =SUMIF()

SUMIF (მაივი ციკლის შიგნით პერიოდის ნომრებით (თვეებისთვის 1-დან 12-მდე); ბმული ციკლის პერიოდის ნომერთან; ბმული მასივთან, წყაროს მონაცემებსა და პერიოდის მნიშვნელობებს შორის სხვაობის კვადრატებით)


4. გამოთვალეთ სტანდარტული გადახრა ციკლის თითოეული პერიოდისთვის 1-დან 12-მდე (სტადია 10 თანდართულ ფაილში).

ამისათვის ჩვენ გამოვყოფთ ფესვს მე-9 ეტაპზე გამოთვლილი მნიშვნელობიდან და ვყოფთ ამ ციკლის პერიოდების რაოდენობაზე მინუს 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

მოდით გამოვიყენოთ ფორმულები Excel =ROOT(R8 (ბმული (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (მაივს ბმული ციკლის ნომრებით); O8 (ბმული კონკრეტული ციკლის ნომერზე, რომელსაც ჩვენ ვითვლით მასივში))-1))

Excel ფორმულის გამოყენებით = COUNTIFჩვენ ვითვლით რიცხვს n


პროგნოზის მოდელიდან რეალური მონაცემების სტანდარტული გადახრის გამოთვლის შემდეგ, ჩვენ მივიღეთ სიგმას მნიშვნელობა ყოველი თვისთვის - ეტაპი 10. თანდართულ ფაილში.

3. გამოვთვალოთ 3 სიგმა.

მე-11 ეტაპზე ჩვენ დავაყენეთ სიგმის რაოდენობა - ჩვენს მაგალითში "3" (სტადია 11 თანდართულ ფაილში):

ასევე მოსახერხებელია სიგმას მნიშვნელობების პრაქტიკაში:

1,64 სიგმა - ლიმიტის გადალახვის 10% შანსი (1 შანსი 10-ში);

1,96 სიგმა - საზღვრებს გასვლის 5% შანსი (1 შანსი 20-ში);

2.6 სიგმა - ლიმიტების გადალახვის 1% შანსი (1 შანსი 100-დან).

5) სამი სიგმის გამოთვლა, ამისათვის ჩვენ ვამრავლებთ "სიგმას" მნიშვნელობებს ყოველი თვისთვის "3-ზე".

3. განსაზღვრეთ ნდობის ინტერვალი.

  1. პროგნოზის ზედა ზღვარი- გაყიდვების პროგნოზი ზრდისა და სეზონურობის გათვალისწინებით + (პლუს) 3 სიგმა;
  2. პროგნოზის ქვედა ზღვარი- გაყიდვების პროგნოზი ზრდისა და სეზონურობის გათვალისწინებით - (მინუს) 3 სიგმა;

ხანგრძლივი პერიოდის განმავლობაში ნდობის ინტერვალის გამოთვლის მოხერხებულობისთვის (იხილეთ თანდართული ფაილი), ჩვენ გამოვიყენებთ Excel-ის ფორმულას =Y8+VLOOKUP(W8,$U$8:$V$19,2,0), სად

Y8- გაყიდვების პროგნოზი;

W8- თვის რიცხვი, რომლისთვისაც ავიღებთ 3-სიგმა მნიშვნელობას;

იმათ. პროგნოზის ზედა ზღვარი= "გაყიდვების პროგნოზი" + "3 სიგმა" (მაგალითად, VLOOKUP (თვის ნომერი; ცხრილი 3 სიგმას მნიშვნელობებით; სვეტი, საიდანაც გამოვყავით სიგმას მნიშვნელობა, რომელიც ტოლია შესაბამის მწკრივში თვის რიცხვის ტოლფასი; 0)).

პროგნოზის ქვედა ზღვარი= "გაყიდვების პროგნოზი" მინუს "3 სიგმა".

ასე რომ, ჩვენ გამოვთვალეთ ნდობის ინტერვალი Excel-ში.

ახლა ჩვენ გვაქვს პროგნოზი და დიაპაზონი საზღვრებით, რომლის ფარგლებშიც რეალური მნიშვნელობები დაეცემა მოცემული სიგმას ალბათობით.

ამ სტატიაში ჩვენ გადავხედეთ რა არის სიგმა და სამი სიგმის წესი, როგორ განვსაზღვროთ ნდობის ინტერვალი და რატომ შეგიძლიათ გამოიყენოთ ეს ტექნიკა პრაქტიკაში.

გისურვებთ ზუსტ პროგნოზებს და წარმატებებს!

Როგორ Forecast4AC PRO დაგეხმარებათნდობის ინტერვალის გაანგარიშებისას?:

    Forecast4AC PRO ავტომატურად გამოთვლის პროგნოზის ზედა ან ქვედა საზღვრებს 1000-ზე მეტი დროის სერიაზე ერთდროულად;

    პროგნოზის საზღვრების ანალიზის უნარი პროგნოზთან, ტრენდთან და რეალურ გაყიდვებთან შედარებით გრაფიკზე ერთი კლავიშის დაჭერით;

Forcast4AC PRO პროგრამაში შესაძლებელია სიგმას მნიშვნელობის დაყენება 1-დან 3-მდე.

Შემოგვიერთდი!

ჩამოტვირთეთ უფასო პროგნოზირებისა და ბიზნესის ანალიზის აპლიკაციები:


  • Novo Forecast Lite- ავტომატური პროგნოზის გაანგარიშებაExcel.
  • 4 ანალიტიკა - ABC-XYZ ანალიზიდა ემისიების ანალიზი Excel.
  • Qlik Senseსამუშაო მაგიდა და QlikViewPersonal Edition - BI სისტემები მონაცემთა ანალიზისა და ვიზუალიზაციისთვის.

შეამოწმეთ ფასიანი გადაწყვეტილებების შესაძლებლობები:

  • Novo Forecast PRO- პროგნოზირება Excel-ში მონაცემთა დიდი ნაკრებისთვის.

ნდობის ინტერვალები ( ინგლისური ნდობის ინტერვალები) სტატისტიკაში გამოყენებული ინტერვალური შეფასების ერთ-ერთი სახეობა, რომელიც გამოითვლება მოცემული მნიშვნელოვნების დონისთვის. ისინი საშუალებას გვაძლევს გავაკეთოთ განცხადება, რომ პოპულაციის უცნობი სტატისტიკური პარამეტრის ჭეშმარიტი მნიშვნელობა არის მნიშვნელობების მიღებულ დიაპაზონში, ალბათობით, რომელიც მითითებულია სტატისტიკური მნიშვნელობის შერჩეული დონით.

Ნორმალური დისტრიბუცია

როდესაც ცნობილია მონაცემების პოპულაციის დისპერსია (σ 2), z- ქულა შეიძლება გამოყენებულ იქნას ნდობის ლიმიტების გამოსათვლელად (ნდობის ინტერვალის ბოლო წერტილები). t-განაწილების გამოყენებასთან შედარებით, z-ქულის გამოყენება საშუალებას მოგცემთ შექმნათ არა მხოლოდ უფრო ვიწრო ნდობის ინტერვალი, არამედ მოსალოდნელი მნიშვნელობისა და სტანდარტული გადახრის (σ) უფრო საიმედო შეფასებები, რადგან z-ქულა ეფუძნება ნორმალური დისტრიბუცია.

ფორმულა

ნდობის ინტერვალის სასაზღვრო წერტილების დასადგენად, იმ პირობით, რომ ცნობილია მონაცემთა პოპულაციის სტანდარტული გადახრა, გამოიყენება შემდეგი ფორმულა

L = X - Z α/2 σ
√n

მაგალითი

დავუშვათ, რომ ნიმუშის ზომა არის 25 დაკვირვება, ნიმუშის მოსალოდნელი მნიშვნელობა არის 15, ხოლო პოპულაციის სტანდარტული გადახრა არის 8. მნიშვნელოვნების დონისთვის α=5%, Z-ქულა არის Z α/2 =1.96. ამ შემთხვევაში, ნდობის ინტერვალის ქვედა და ზედა ზღვარი იქნება

L = 15 - 1.96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

ამრიგად, შეგვიძლია ვთქვათ, რომ 95%-იანი ალბათობით მოსახლეობის მათემატიკური მოლოდინი დაეცემა 11.864-დან 18.136-მდე დიაპაზონში.

ნდობის ინტერვალის შემცირების მეთოდები

დავუშვათ, რომ დიაპაზონი ძალიან ფართოა ჩვენი კვლევის მიზნებისთვის. ნდობის ინტერვალის დიაპაზონის შემცირების ორი გზა არსებობს.

  1. სტატისტიკური მნიშვნელოვნების დონის შემცირება α.
  2. ნიმუშის ზომის გაზრდა.

სტატისტიკური მნიშვნელოვნების დონის α=10%-მდე დაყვანით ვიღებთ Z-ს ქულას ტოლი Z α/2 =1,64. ამ შემთხვევაში, ინტერვალის ქვედა და ზედა საზღვრები იქნება

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

და თავად ნდობის ინტერვალი შეიძლება დაიწეროს როგორც

ამ შემთხვევაში შეგვიძლია გამოვიტანოთ ვარაუდი, რომ 90%-იანი ალბათობით მოსახლეობის მათემატიკური მოლოდინი დიაპაზონში მოხვდება.

თუ გვინდა, რომ არ შევამციროთ α სტატისტიკური მნიშვნელოვნების დონე, მაშინ ერთადერთი ალტერნატივა არის ნიმუშის ზომის გაზრდა. მისი გაზრდით 144 დაკვირვებამდე, ვიღებთ ნდობის ლიმიტების შემდეგ მნიშვნელობებს

L = 15 - 1.96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

თავად ნდობის ინტერვალს ექნება შემდეგი ფორმა

ამრიგად, ნდობის ინტერვალის შევიწროება სტატისტიკური მნიშვნელოვნების დონის შემცირების გარეშე შესაძლებელია მხოლოდ შერჩევის ზომის გაზრდით. თუ ნიმუშის ზომის გაზრდა შეუძლებელია, მაშინ ნდობის ინტერვალის შევიწროება მიიღწევა მხოლოდ სტატისტიკური მნიშვნელოვნების დონის შემცირებით.

ნდობის ინტერვალის აგება ნორმალური განაწილებისთვის

თუ პოპულაციის სტანდარტული გადახრა უცნობია ან განაწილება განსხვავდება ნორმალურისგან, t-განაწილება გამოიყენება ნდობის ინტერვალის ასაგებად. ეს ტექნიკა უფრო კონსერვატიულია, რაც აისახება უფრო ფართო ნდობის ინტერვალებში, Z- ქულაზე დაფუძნებულ ტექნიკასთან შედარებით.

ფორმულა

ნდობის ინტერვალის ქვედა და ზედა ზღვრების გამოსათვლელად t-განაწილების საფუძველზე გამოიყენეთ შემდეგი ფორმულები

L = X - t α σ
√n

სტუდენტური განაწილება ან t-განაწილება დამოკიდებულია მხოლოდ ერთ პარამეტრზე - თავისუფლების ხარისხების რაოდენობაზე, რომელიც უდრის ატრიბუტის ინდივიდუალური მნიშვნელობების რაოდენობას (ნიმუშში დაკვირვების რაოდენობა). სტუდენტის t-ტესტის მნიშვნელობა თავისუფლების ხარისხების მოცემული რაოდენობისთვის (n) და სტატისტიკური მნიშვნელოვნების α დონე შეგიძლიათ იხილოთ საცნობარო ცხრილებში.

მაგალითი

დავუშვათ, რომ ნიმუშის ზომა არის 25 ინდივიდუალური მნიშვნელობა, ნიმუშის მოსალოდნელი მნიშვნელობა არის 50, ხოლო ნიმუშის სტანდარტული გადახრა არის 28. აუცილებელია სარწმუნო ინტერვალის აგება სტატისტიკური მნიშვნელოვნების დონისთვის α=5%.

ჩვენს შემთხვევაში, თავისუფლების გრადუსების რაოდენობაა 24 (25-1), შესაბამისად, სტუდენტის t-ტესტის შესაბამისი ცხრილის მნიშვნელობა სტატისტიკური მნიშვნელოვნების α=5% დონისთვის არის 2,064. ამრიგად, ნდობის ინტერვალის ქვედა და ზედა ზღვარი იქნება

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

და თავად ინტერვალი შეიძლება დაიწეროს ფორმით

ამრიგად, შეგვიძლია ვთქვათ, რომ 95%-იანი ალბათობით, მოსახლეობის მათემატიკური მოლოდინი იქნება დიაპაზონში.

t განაწილების გამოყენება საშუალებას გაძლევთ შეამციროთ ნდობის ინტერვალი სტატისტიკური მნიშვნელობის შემცირებით ან შერჩევის ზომის გაზრდით.

სტატისტიკური მნიშვნელოვნების 95%-დან 90%-მდე შემცირებით ჩვენი მაგალითის პირობებში, მივიღებთ Student-ის t-ტესტის შესაბამის ცხრილის მნიშვნელობას 1.711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

ამ შემთხვევაში შეგვიძლია ვთქვათ, რომ 90%-იანი ალბათობით მოსახლეობის მათემატიკური მოლოდინი იქნება დიაპაზონში.

თუ არ გვინდა სტატისტიკური მნიშვნელოვნების შემცირება, მაშინ ერთადერთი ალტერნატივა შერჩევის ზომის გაზრდაა. ვთქვათ, ეს არის 64 ინდივიდუალური დაკვირვება და არა 25, როგორც ეს მაგალითის თავდაპირველ მდგომარეობაში იყო. სტუდენტის t-ტესტის ცხრილის მნიშვნელობა თავისუფლების 63 გრადუსზე (64-1) და სტატისტიკური მნიშვნელოვნების დონე α=5% არის 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

ეს საშუალებას გვაძლევს ვთქვათ, რომ 95%-იანი ალბათობით მოსახლეობის მათემატიკური მოლოდინი იქნება დიაპაზონში.

დიდი ნიმუშები

დიდი ნიმუშები არის ნიმუშები მონაცემთა პოპულაციისგან, რომელშიც ინდივიდუალური დაკვირვებების რაოდენობა 100-ს აჭარბებს. სტატისტიკურმა კვლევებმა აჩვენა, რომ უფრო დიდი ნიმუშები ჩვეულებრივ ნაწილდება, მაშინაც კი, თუ პოპულაციის განაწილება არ არის ნორმალური. გარდა ამისა, ასეთი ნიმუშებისთვის, z-ქულის და t-განაწილების გამოყენება იძლევა დაახლოებით იგივე შედეგებს სანდო ინტერვალების აგებისას. ამრიგად, დიდი ნიმუშებისთვის მისაღებია t-განაწილების ნაცვლად z-ქულის გამოყენება ნორმალური განაწილებისთვის.

მოდით შევაჯამოთ