Calculați limita dreaptă a intervalului de încredere pentru percentilă. Construirea unui interval de încredere pentru așteptarea matematică a populației

Ţintă– predarea elevilor algoritmi pentru calcularea intervalelor de încredere ale parametrilor statistici.

La prelucrarea statistică a datelor, media aritmetică calculată, coeficientul de variație, coeficientul de corelație, criteriile de diferență și alte statistici punctuale ar trebui să primească limite cantitative de încredere, care indică posibile fluctuații ale indicatorului în direcții din ce în ce mai mari în intervalul de încredere.

Exemplul 3.1 . Distribuția calciului în serul sanguin al maimuțelor, așa cum a fost stabilită anterior, se caracterizează prin următorii indicatori de probă: = 11,94 mg%; = 0,127 mg%; n= 100. Este necesar să se determine intervalul de încredere pentru media generală ( ) cu probabilitate de încredere P = 0,95.

Media generală este situată cu o anumită probabilitate în intervalul:

, Unde – medie aritmetică eșantionului; t– testul elevului; – eroarea mediei aritmetice.

Folosind tabelul „Valorile testului t ale elevului” găsim valoarea cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100-1 = 99. Este egal cu 1,982. Împreună cu valorile mediei aritmetice și ale erorii statistice, o înlocuim în formula:

sau 11,69
12,19

Astfel, cu o probabilitate de 95%, se poate afirma că media generală a acestei distribuții normale este cuprinsă între 11,69 și 12,19 mg%.

Exemplul 3.2 . Determinați limitele intervalului de încredere de 95% pentru varianța generală ( ) distribuția calciului în sângele maimuțelor, dacă se știe că
= 1,60, at n = 100.

Pentru a rezolva problema puteți folosi următoarea formulă:

Unde – eroarea statistică de dispersie.

Găsim eroarea varianței de eșantionare folosind formula:
. Este egal cu 0,11. Sens t- criteriu cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100–1 = 99 este cunoscut din exemplul anterior.

Să folosim formula și să obținem:

sau 1,38
1,82

Mai precis, intervalul de încredere al varianței generale poate fi construit folosind (chi-pătrat) - testul Pearson. Punctele critice pentru acest criteriu sunt date într-un tabel special. La folosirea criteriului Pentru a construi un interval de încredere, se utilizează un nivel de semnificație cu două fețe. Pentru limita inferioară, nivelul de semnificație este calculat folosind formula
, pentru partea de sus -
. De exemplu, pentru nivelul de încredere = 0,99= 0,010,= 0,990. În consecință, conform tabelului de distribuție a valorilor critice , cu niveluri de încredere calculate și numărul de grade de libertate k= 100 – 1= 99, găsiți valorile
Și
. Primim
este egal cu 135,80 și
este egal cu 70,06.

Pentru a găsi limitele de încredere pentru varianța generală folosind Să folosim formulele: pentru limita inferioară
, pentru limita superioară
. Să înlocuim valorile găsite cu datele problemei în formule:
= 1,17;
= 2,26. Astfel, cu o probabilitate de încredere P= 0,99 sau 99% varianță generală va fi în intervalul de la 1,17 la 2,26 mg% inclusiv.

Exemplul 3.3 . Dintre 1000 de semințe de grâu din lotul primit la lift, 120 de semințe au fost găsite infectate cu ergot. Este necesar să se determine limitele probabile ale proporției generale de semințe infectate într-un anumit lot de grâu.

Este recomandabil să se determine limitele de încredere pentru cota generală pentru toate valorile sale posibile folosind formula:

,

Unde n – numărul de observații; m– dimensiunea absolută a unuia dintre grupuri; t– abatere normalizată.

Proporția eșantionului de semințe infectate este
sau 12%. Cu probabilitate de încredere R= abatere normalizată de 95% ( t-Testul elevului la k =
)t = 1,960.

Înlocuim datele disponibile în formula:

Prin urmare, limitele intervalului de încredere sunt egale cu = 0,122–0,041 = 0,081 sau 8,1%; = 0,122 + 0,041 = 0,163 sau 16,3%.

Astfel, cu o probabilitate de încredere de 95% se poate afirma că proporția generală a semințelor infectate este între 8,1 și 16,3%.

Exemplul 3.4 . Coeficientul de variație care caracterizează variația calciului (mg%) în serul sanguin al maimuțelor a fost egal cu 10,6%. Marime de mostra n= 100. Este necesar să se determine limitele intervalului de încredere de 95% pentru parametrul general CV.

Limitele intervalului de încredere pentru coeficientul general de variație CV sunt determinate de următoarele formule:

Și
, Unde K valoare intermediară calculată prin formula
.

Știind asta cu probabilitate de încredere R= 95% abatere normalizată (testul studentului la k =
)t = 1,960, să calculăm mai întâi valoarea LA:

.

sau 9,3%

sau 12,3%

Astfel, coeficientul general de variație cu un nivel de încredere de 95% se află în intervalul de la 9,3 la 12,3%. La probe repetate, coeficientul de variație nu va depăși 12,3% și nu va fi sub 9,3% în 95 de cazuri din 100.

Întrebări pentru autocontrol:

Probleme pentru rezolvare independentă.

1. Procentul mediu de grăsime din lapte în timpul lactației vacilor încrucișate Kholmogory a fost următorul: 3,4; 3,6; 3,2; 3.1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4.1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Stabiliți intervale de încredere pentru media generală la un nivel de încredere de 95% (20 de puncte).

2. La 400 de plante hibride de secară, primele flori au apărut în medie la 70,5 zile de la semănat. Abaterea standard a fost de 6,9 ​​zile. Determinați eroarea mediei și a intervalelor de încredere pentru media generală și varianța la nivelul de semnificație W= 0,05 și W= 0,01 (25 puncte).

3. La studierea lungimii frunzelor a 502 exemplare de căpșuni de grădină s-au obținut următoarele date: = 7,86 cm; σ = 1,32 cm, =± 0,06 cm.Să se determine intervalele de încredere pentru media aritmetică a populației cu niveluri de semnificație de 0,01; 0,02; 0,05. (25 de puncte).

4. Într-un studiu pe 150 de bărbați adulți, înălțimea medie a fost de 167 cm și σ = 6 cm.Care sunt limitele mediei generale și ale varianței generale cu o probabilitate de încredere de 0,99 și 0,95? (25 de puncte).

5. Distribuția calciului în serul sanguin al maimuțelor este caracterizată de următorii indicatori selectivi: = 11,94 mg%, σ = 1,27, n = 100. Construiți un interval de încredere de 95% pentru media generală a acestei distribuții. Calculați coeficientul de variație (25 de puncte).

6. A fost studiat conținutul total de azot din plasma sanguină a șobolanilor albinoși la vârsta de 37 și 180 de zile. Rezultatele sunt exprimate în grame la 100 cm3 de plasmă. La vârsta de 37 de zile, 9 șobolani aveau: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. La vârsta de 180 de zile, 8 șobolani aveau: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Setați intervale de încredere pentru diferență la un nivel de încredere de 0,95 (50 de puncte).

7. Determinați limitele intervalului de încredere de 95% pentru variația generală a distribuției calciului (mg%) în serul sanguin al maimuțelor, dacă pentru această distribuție dimensiunea eșantionului este n = 100, eroarea statistică a varianței eșantionului s σ 2 = 1,60 (40 de puncte).

8. Determinați limitele intervalului de încredere de 95% pentru varianța generală a distribuției a 40 de spiculeți de grâu de-a lungul lungimii (σ 2 = 40,87 mm 2). (25 de puncte).

9. Fumatul este considerat principalul factor predispozitiv la bolile pulmonare obstructive. Fumatul pasiv nu este considerat un astfel de factor. Oamenii de știință s-au îndoit de inofensivitatea fumatului pasiv și au examinat permeabilitatea căilor respiratorii a nefumătorilor, fumătorilor pasivi și activi. Pentru a caracteriza starea tractului respirator, am luat unul dintre indicatorii funcției de respirație externă - debitul volumetric maxim de la mijlocul expirării. O scădere a acestui indicator este un semn de obstrucție a căilor respiratorii. Datele sondajului sunt prezentate în tabel.

Numărul de persoane examinate

Debitul maxim mediu expirator, l/s

Deviație standard

nefumători

lucrează într-o zonă de nefumători

lucrând într-o cameră plină de fum

Fumat

fumează un număr mic de țigări

numărul mediu de fumători de țigări

fumează un număr mare de țigări

Folosind datele din tabel, găsiți intervale de încredere de 95% pentru media generală și varianța generală pentru fiecare grup. Care sunt diferențele dintre grupuri? Prezentați rezultatele grafic (25 de puncte).

10. Determinați limitele intervalelor de încredere de 95% și 99% pentru variația generală a numărului de purcei din 64 de fătări, dacă eroarea statistică a varianței eșantionului s σ 2 = 8,25 (30 puncte).

11. Se știe că greutatea medie a iepurilor este de 2,1 kg. Determinați limitele intervalelor de încredere de 95% și 99% pentru media generală și varianța la n= 30, σ = 0,56 kg (25 puncte).

12. Conținutul de boabe al spicului a fost măsurat pentru 100 de spice ( X), lungimea urechii ( Y) și masa de cereale în spic ( Z). Găsiți intervalele de încredere pentru media generală și varianța la P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 dacă = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29.153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 puncte).

13. În 100 de spice alese aleatoriu de grâu de iarnă a fost numărat numărul de spiculete. Populația eșantionului a fost caracterizată de următorii indicatori: = 15 spiculete și σ = 2,28 buc. Determinați cu ce precizie a fost obținut rezultatul mediu ( ) și construiți un interval de încredere pentru media generală și varianța la niveluri de semnificație de 95% și 99% (30 de puncte).

14. Numărul de coaste pe cochilii de moluște fosile Orthamboniții calligramma:

Se știe că n = 19, σ = 4,25. Determinați limitele intervalului de încredere pentru media generală și varianța generală la nivelul semnificației W = 0,01 (25 puncte).

15. Pentru determinarea randamentului de lapte într-o fermă comercială de lapte, s-a determinat zilnic productivitatea a 15 vaci. Conform datelor pe an, fiecare vacă a dat în medie următoarea cantitate de lapte pe zi (l): 22; 19; 25; 20; 27; 17; treizeci; 21; 18; 24; 26; 23; 25; 20; 24. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca producția medie anuală de lapte per vaca să fie de 10.000 de litri? (50 de puncte).

16. Pentru determinarea randamentului mediu de grâu pentru întreprinderea agricolă s-a efectuat cosit pe loturi de probă de 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 și 2 hectare. Productivitatea (c/ha) de pe parcele a fost de 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 respectiv. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca randamentul mediu agricol să fie de 42 c/ha? (50 de puncte).

Intervalul de încredere ne vine din domeniul statisticii. Acesta este un anumit interval care servește la estimarea unui parametru necunoscut cu un grad ridicat de fiabilitate. Cel mai simplu mod de a explica acest lucru este cu un exemplu.

Să presupunem că trebuie să studiați o variabilă aleatoare, de exemplu, viteza de răspuns a serverului la o solicitare a clientului. De fiecare dată când un utilizator introduce adresa unui anumit site, serverul răspunde cu viteze diferite. Astfel, timpul de răspuns studiat este aleatoriu. Deci, intervalul de încredere ne permite să determinăm limitele acestui parametru și apoi putem spune că cu o probabilitate de 95% serverul va fi în intervalul pe care l-am calculat.

Sau trebuie să aflați câți oameni știu despre marca comercială a companiei. Când se calculează intervalul de încredere, se va putea spune, de exemplu, că, cu o probabilitate de 95%, ponderea consumatorilor conștienți de acest lucru este în intervalul de la 27% la 34%.

Strâns legată de acest termen este valoarea probabilității de încredere. Reprezintă probabilitatea ca parametrul dorit să fie inclus în intervalul de încredere. Cât de mare va fi intervalul nostru dorit depinde de această valoare. Cu cât este mai mare valoarea pe care o ia, cu atât intervalul de încredere devine mai îngust și invers. De obicei, este setat la 90%, 95% sau 99%. Valoarea 95% este cea mai populară.

Acest indicator este influențat și de dispersia observațiilor și definirea lui se bazează pe presupunerea că caracteristica studiată se supune.Această afirmație este cunoscută și sub numele de Legea lui Gauss. Potrivit lui, normala este o distribuție a tuturor probabilităților unei variabile aleatoare continue care poate fi descrisă printr-o densitate de probabilitate. Dacă ipoteza unei distribuții normale este incorectă, atunci estimarea poate fi incorectă.

Mai întâi, să ne dăm seama cum să calculăm intervalul de încredere pentru Există două cazuri posibile aici. Dispersia (gradul de răspândire a unei variabile aleatoare) poate fi cunoscută sau nu. Dacă este cunoscut, atunci intervalul nostru de încredere este calculat folosind următoarea formulă:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - semn,

t - parametru din tabelul de distribuție Laplace,

σ este rădăcina pătrată a varianței.

Dacă varianța este necunoscută, atunci poate fi calculată dacă cunoaștem toate valorile caracteristicii dorite. Pentru aceasta se folosește următoarea formulă:

σ2 = х2ср - (хср)2, unde

х2ср - valoarea medie a pătratelor caracteristicii studiate,

(хср)2 este pătratul acestei caracteristici.

Formula prin care se calculează intervalul de încredere în acest caz se modifică ușor:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - medie eșantion,

α - semn,

t este un parametru care se găsește folosind tabelul de distribuție Student t = t(ɣ;n-1),

sqrt(n) - rădăcina pătrată a dimensiunii totale a eșantionului,

s este rădăcina pătrată a varianței.

Luați în considerare acest exemplu. Să presupunem că pe baza rezultatelor a 7 măsurători, caracteristica studiată a fost determinată a fi egală cu 30, iar varianța eșantionului să fie egală cu 36. Este necesar să se găsească, cu o probabilitate de 99%, un interval de încredere care să conțină adevăratul valoarea parametrului măsurat.

Mai întâi, să determinăm cu ce t este egal: t = t (0,99; 7-1) = 3,71. Folosind formula de mai sus, obținem:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Intervalul de încredere pentru varianță se calculează atât în ​​cazul unei medii cunoscute, cât și atunci când nu există date despre așteptarea matematică și se cunoaște doar valoarea estimării punctuale a varianței. Nu vom da aici formule de calcul, deoarece acestea sunt destul de complexe și, dacă se dorește, pot fi întotdeauna găsite pe Internet.

Să remarcăm doar că este convenabil să determinați intervalul de încredere folosind Excel sau un serviciu de rețea, care se numește astfel.

Instrucțiuni

Te rog noteaza asta interval(l1 sau l2), a cărei zonă centrală va fi estimarea l* și, de asemenea, în care este probabil să fie conținută valoarea adevărată a parametrului, va fi încrederea interval om sau valoarea corespunzătoare a probabilității de încredere alfa. În acest caz, l* însuși se va referi la estimări punctuale. De exemplu, pe baza rezultatelor oricăror valori ale eșantionului unei valori aleatoare X (x1, x2,..., xn), este necesar să se calculeze parametrul necunoscut al indicatorului l, de care va depinde distribuția. În acest caz, obținerea unei estimări a unui parametru dat l* va consta în faptul că pentru fiecare probă va fi necesar să se atribuie o anumită valoare a parametrului, adică să se creeze o funcție a rezultatelor observației indicatorului Q , a cărui valoare va fi luată egală cu valoarea estimată a parametrului l* sub forma formulei : l*=Q*(x1, x2,..., xn).

Vă rugăm să rețineți că orice funcție bazată pe rezultatele observației se numește statistici. Mai mult, dacă descrie complet parametrul (fenomenul) luat în considerare, atunci se numește statistici suficiente. Și pentru că rezultatele observațiilor sunt aleatoare, l* va fi și o variabilă aleatoare. Sarcina de calculare a statisticilor trebuie efectuată ținând cont de criteriile pentru calitatea acesteia. Aici este necesar să se țină cont de faptul că legea distribuției estimării este destul de definită, distribuția densității de probabilitate W(x, l).

Puteți calcula încrederea interval destul de simplu dacă cunoașteți legea despre repartizarea evaluării. De exemplu, un mandatar interval estimări în raport cu așteptarea matematică (valoarea medie a unei valori aleatorii) mx* =(1/n)*(x1+x2+ …+xn) . Această estimare va fi imparțială, adică așteptarea matematică sau valoarea medie a indicatorului va fi egală cu valoarea adevărată a parametrului (M(mx*) = mx).

Puteți stabili că varianța estimării pe baza așteptării matematice este: bx*^2=Dx/n. Pe baza teoremei centrale a limitei, putem trage concluzia corespunzătoare că legea de distribuție a acestei estimări este gaussiană (normală). Prin urmare, pentru a efectua calcule, puteți utiliza indicatorul Ф(z) - integrala probabilităților. În acest caz, selectați lungimea încrederii intervalși 2ld, deci obțineți: alfa = P(mx-ld (folosind proprietatea integralei de probabilitate conform formulei: Ф(-z)=1- Ф(z)).

A cladi increderea interval estimări ale așteptărilor matematice: - găsiți valoarea formulei (alfa + 1)/2; - selectați din tabelul integral de probabilitate o valoare egală cu lд/sqrt(Dx/n); - estimați dispersia adevărată: Dx *=(1/n)*( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); - determinați ld; - găsiți încrederea interval după formula: (mx*-ld, mx*+ld).

Să presupunem că avem un număr mare de articole cu o distribuție normală a unor caracteristici (de exemplu, un depozit complet de legume de același tip, a căror dimensiune și greutate variază). Vrei să știi caracteristicile medii ale întregului lot de mărfuri, dar nu ai nici timp, nici dorința de a măsura și cântări fiecare legumă. Înțelegi că acest lucru nu este necesar. Dar câte piese ar trebui luate pentru o verificare la fața locului?

Înainte de a oferi mai multe formule utile pentru această situație, să ne amintim câteva notații.

În primul rând, dacă am măsura întregul depozit de legume (acest set de elemente se numește populația generală), atunci am ști cu toată exactitatea disponibilă greutatea medie a întregului lot. Să numim această medie medie X .g en . - media generală. Știm deja ce este complet determinat dacă valoarea medie și abaterea s sunt cunoscute . Adevărat, deși nu suntem nici genul mediu X, nici s Nu cunoaștem populația generală. Putem lua doar o anumită probă, să măsurăm valorile de care avem nevoie și să calculăm pentru această probă atât valoarea medie X, cât și abaterea standard S selectată.

Se știe că dacă verificarea noastră eșantion conține un număr mare de elemente (de obicei n este mai mare de 30), și acestea sunt luate într-adevăr aleatoriu, apoi s populația generală nu va diferi cu greu de selecția S ..

În plus, pentru cazul distribuției normale putem folosi următoarele formule:

Cu o probabilitate de 95%


Cu o probabilitate de 99%



În general, cu probabilitatea P (t)


Relația dintre valoarea t și valoarea probabilității P (t), cu care dorim să cunoaștem intervalul de încredere, poate fi luată din următorul tabel:


Astfel, am determinat în ce interval se află valoarea medie a populației (cu o probabilitate dată).

Dacă nu avem un eșantion suficient de mare, nu putem spune că populația are s = S selectează În plus, în acest caz, apropierea eșantionului de distribuția normală este problematică. În acest caz, folosim și S select în schimb s în formula:




dar valoarea lui t pentru o probabilitate fixă ​​P(t) va depinde de numărul de elemente din eșantionul n. Cu cât n este mai mare, cu atât intervalul de încredere rezultat va fi mai apropiat de valoarea dată de formula (1). Valorile t în acest caz sunt preluate dintr-un alt tabel (testul t al studentului), pe care îl prezentăm mai jos:

Valorile testului t al lui Student pentru probabilitatea 0,95 și 0,99


Exemplul 3. 30 de persoane au fost alese aleatoriu dintre angajații companiei. Potrivit eșantionului, s-a dovedit că salariul mediu (pe lună) este de 30 de mii de ruble, cu o abatere standard de 5 mii de ruble. Determinați salariul mediu în companie cu o probabilitate de 0,99.

Soluţie: Prin condiție avem n = 30, X avg. =30000, S=5000, P = 0,99. Pentru a găsi intervalul de încredere, vom folosi formula corespunzătoare testului t Student. Din tabelul pentru n = 30 și P = 0,99 găsim t = 2,756, prin urmare,


acestea. mandatar căutat interval 27484< Х ср.ген < 32516.

Deci, cu o probabilitate de 0,99 putem spune că intervalul (27484; 32516) conține în sine salariul mediu în firmă.

Sperăm că veți folosi această metodă și nu este necesar să aveți o masă cu dvs. de fiecare dată. Calculele pot fi efectuate automat în Excel. În timp ce vă aflați în fișierul Excel, faceți clic pe butonul fx din meniul de sus. Apoi, selectați tipul „statistic” dintre funcții, iar din lista propusă în fereastra - STUDAR DISCOVER. Apoi, la prompt, plasând cursorul în câmpul „probabilitate”, introduceți valoarea probabilității inverse (adică, în cazul nostru, în loc de probabilitatea de 0,95, trebuie să introduceți probabilitatea de 0,05). Aparent, foaia de calcul este concepută în așa fel încât rezultatul să răspundă la întrebarea cât de probabil avem să greșim. În mod similar, în câmpul Grad de libertate, introduceți o valoare (n-1) pentru eșantionul dvs.

Interval de încredere pentru așteptările matematice - acesta este un interval calculat din date care, cu o probabilitate cunoscuta, contine asteptarea matematica a populatiei generale. O estimare naturală a așteptărilor matematice este media aritmetică a valorilor observate. Prin urmare, pe parcursul lecției vom folosi termenii „medie” și „valoare medie”. În problemele de calculare a unui interval de încredere, un răspuns cel mai adesea cerut este ceva de genul „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Folosind un interval de încredere, puteți evalua nu numai valorile medii, ci și proporția unei anumite caracteristici a populației generale. Valorile medii, dispersia, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt discutate în lecție Caracteristicile eșantionului și populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației este estimată printr-un număr (punct), atunci o medie specifică, care este calculată dintr-un eșantion de observații, este luată ca o estimare a valorii medii necunoscute a populației. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când indicați media eșantionului, trebuie să indicați simultan eroarea de eșantionare. Măsura erorii de eșantionare este eroarea standard, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes în populație trebuie evaluat nu printr-un număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate P se constată valoarea indicatorului populaţiei estimate. Interval de încredere în care este probabil P = 1 - α se găsește variabila aleatoare, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației este necunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului n ar trebui înlocuit cu n-1.

Exemplul 1. S-au colectat informații din 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din acestea este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% pentru numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptările matematice.

Să calculăm abaterea standard:

,

Să calculăm valoarea medie:

.

Înlocuim valorile în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3. Pentru un eșantion de populație aleatoriu de 100 de observații, media calculată este 15,2 și abaterea standard este 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Substituim din nou aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat între 14,37 și 16,02.

După cum vedem, pe măsură ce coeficientul de încredere crește, crește și valoarea critică a distribuției normale standard și, în consecință, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și astfel intervalul de încredere pentru așteptarea matematică crește. .

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unui atribut al eșantionului poate fi interpretată ca o estimare punctuală a cotei p de aceeaşi caracteristică în populaţia generală. Dacă această valoare trebuie să fie asociată cu probabilitatea, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populaţie cu probabilitate P = 1 - α :

.

Exemplul 4.Într-un oraș sunt doi candidați AȘi B candideaza pentru functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că ar vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.