Ce determină lățimea intervalului de încredere? Intervale de încredere

Din acest articol veți învăța:

    Ce s-a întâmplat interval de încredere?

    Care e ideea regulile 3 sigma?

    Cum poți aplica aceste cunoștințe în practică?

În prezent, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, domenii de activitate etc., poate fi dificil să evidențiezi principalul lucru, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza valorilor reale care depășesc limitele sale - o tehnică care vă va ajuta să evidențiați situațiile, influențând tendințele în schimbare. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale bine-cunoscute.

Există așa-numitele " alerte", care informează managerii că următoarea valoare este într-o anumită direcție a trecut dincolo interval de încredere. Ce înseamnă acest lucru? Acesta este un semnal că a avut loc un eveniment neobișnuit, care poate schimba tendința existentă în această direcție. Acesta este un semnal la asta pentru a-l da seamaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limite estimate pentru 100 de articole de produs pentru 2011 pe lună și vânzările reale în martie:

  1. Pentru „uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” am depășit limita inferioară a prognozei.
  3. „Teci de ovăz” a depășit limita superioară.

Pentru alte produse, vânzările efective s-au încadrat în limitele prognozate date. Acestea. vânzările lor au fost în limitele așteptărilor. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce le-a influențat să treacă dincolo de granițe:

  1. Pentru uleiul de floarea soarelui am intrat într-o nouă rețea de distribuție, care ne-a oferit un volum suplimentar de vânzări, ceea ce ne-a determinat să depășim limita superioară. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări pentru această rețea.
  2. Pentru „Drojdie uscată”, mașina s-a blocat la vamă și a existat un deficit în 5 zile, ceea ce a afectat scăderea vânzărilor și a depășit limita inferioară. Ar putea fi util să vă dați seama ce a cauzat-o și să încercați să nu repetați această situație.
  3. A fost lansat un eveniment de promovare a vânzărilor pentru Terci de ovăz, care a dat o creștere semnificativă a vânzărilor și a făcut ca compania să depășească prognoza.

Am identificat 3 factori care au influențat depășirea limitelor prognozate. Pot fi mult mai multe în viață.Pentru a crește acuratețea prognozelor și a planificării, factori care duc la faptul că vânzările efective pot depăși previziunile, merită să evidențiem și să construiți previziuni și planuri pentru ele separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine. prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere putem:

  1. Selectați indicațiile de orientare, cărora merită să le acordați atenție, pentru că s-au produs evenimente în aceste direcţii care pot afecta schimbare de tendință.
  2. Identificați factorii, care influențează cu adevărat schimbarea situației.
  3. Accept decizie informată(de exemplu, despre achiziție, planificare etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în interiorul cărora cu o probabilitate dată (sigma) vor apărea valorile reale.

Acestea. Calculăm prognoza - acesta este ghidul nostru principal, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea, în ce limite valorile reale pot scădea, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele de prognoză date. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea ca următoarea valoare reală să cadă în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși granițele.

    2 sigma- atunci, probabilitatea ca următoarea valoare să se încadreze în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1 sau există o șansă de 4,5% să treci peste bord.

    1 sigma- atunci probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1 sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat regula 3 sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat teorema că există o probabilitate de 10% de a depăși limitele prognozate cu o valoare dată de trei sigma. Acestea. probabilitatea de a se încadra în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum să calculezi singur un interval de încredere în Excel?

Să ne uităm la calculul intervalului de încredere în Excel (adică, limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe lună timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele de prognoză, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date de serie temporală)- RC[-1] (valoarea modelului))^2(pătrat)


3. Pentru fiecare lună, să însumăm valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică. Să rezumam ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numerele perioadei din interiorul ciclului (pentru luni de la 1 la 12); link la numărul perioadei din ciclu; link la o matrice cu pătrate ale diferenței dintre datele sursă și valorile perioadei)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, extragem rădăcina din valoarea calculată la etapa 9 și împărțim la numărul de perioade din acest ciclu minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Să folosim formulele din Excel =ROOT(R8 (link către (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link la matrice cu numere de ciclu); O8 (link la un anumit număr de ciclu pe care îl numărăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


După ce am calculat abaterea standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Să calculăm 3 sigma.

La etapa 11 setăm numărul de sigma - în exemplul nostru „3” (etapa 11 in fisierul atasat):

De asemenea, convenabil pentru exersarea valorilor sigma:

1,64 sigma - 10% sanse de depasire a limitei (1 sansa din 10);

1,96 sigma - 5% șansă de a depăși limitele (1 șansă din 20);

2,6 sigma - 1% șansă de a depăși limitele (1 șansă la 100).

5) Calcularea trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- previziunea vanzarilor tinand cont de crestere si sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate – (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), vom folosi formula Excel =Y8+CĂUTARE V(W8, 8 USD: 19 USD, 2,0 USD), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea 3-sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o probabilitate sigma dată.

În acest articol, am analizat ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și de ce puteți utiliza această tehnică în practică.

Vă dorim prognoze corecte și succes!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare ale prognozei pentru mai mult de 1000 de serii temporale simultan;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO este posibil să setați valoarea sigma de la 1 la 3.

Alăturaţi-ne!

Descărcați aplicații gratuite de prognoză și analiză de afaceri:


  • Novo Forecast Lite- automată calculul prognozei V excela.
  • 4analitica - Analiza ABC-XYZși analiza emisiilor Excela.
  • Qlik Sense Desktop și QlikViewPersonal Edition - sisteme BI pentru analiza și vizualizarea datelor.

Testați capacitățile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru seturi mari de date.

Și altele, toate sunt estimări ale analogilor lor teoretici, care ar putea fi obținute dacă nu ar fi disponibil un eșantion, ci o populație generală. Dar, din păcate, populația generală este foarte scumpă și adesea inaccesibilă.

Conceptul de estimare a intervalului

Orice estimare a eșantionului are o oarecare răspândire, pentru că este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru concluzii statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul evaluat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T 1 (X)Și T 2 (X), Ce T 1< T 2 , pentru care la un nivel de probabilitate dat γ este îndeplinită condiția:

Pe scurt, este probabil γ sau mai mult indicatorul adevărat este între puncte T 1 (X)Și T 2 (X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construirea intervalelor de încredere este îngustimea maximă a acestuia, adică. ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că... cercetătorul încearcă să localizeze mai precis locația parametrului dorit.

Rezultă că intervalul de încredere trebuie să acopere probabilitățile maxime ale distribuției. iar evaluarea în sine ar trebui să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie remarcat faptul că pentru distribuțiile asimetrice, intervalul din dreapta nu este egal cu intervalul din stânga.

Figura de mai sus arată clar că, cu cât probabilitatea de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o scurtă introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - așteptarea și variația, care sunt de obicei necunoscute. Puteți folosi, desigur, estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi complet normală, va fi ușor aplatizată în jos. Acest fapt a fost remarcat inteligent de cetățeanul irlandez William Gosset, publicându-și descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset s-a semnat Student. Așa a apărut distribuția t Student.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața pământească și este destul de greu de stabilit (pentru o precizie ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza de normalitate și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe variante ale acesteia (formulările s-au rafinat de-a lungul anilor), dar toate, în linii mari, se rezumă la afirmația că suma unui număr mare de variabile aleatoare independente se supune legii distribuției normale.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. De aici rezultă că media aritmetică are o distribuție normală, în care așteptarea este așteptarea datelor originale, iar varianța este .

Oamenii inteligenți știu să demonstreze CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind funcția Excel RANDBETWEEN). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă dimensiunea și numărul eșantionului sunt și mai mari, asemănarea va fi și mai bună.

Acum că am văzut cu ochii noștri validitatea CLT, putem, folosind , calcula intervale de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, trebuie să cunoașteți parametrii distribuției normale. De regulă, nu există, așa că sunt utilizate estimări: medie aritmeticăȘi varianța eșantionului. Repet, această metodă oferă o aproximare bună doar cu mostre mari. Când mostrele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția Student pentru medie apare numai atunci când datele originale sunt distribuite în mod normal, adică aproape niciodată. Prin urmare, este mai bine să setați imediat o bară minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu veți greși.

T 1.2– limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s 0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – probabilitatea de încredere (de obicei egală cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2)– valoarea inversă a funcției de distribuție normală standard. Mai simplu spus, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (aceste trei probabilități corespund valorilor de 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul este cunoscut, luați-l și luați în considerare.

Înainte de utilizarea pe scară largă a computerelor personale, acestea obțineau valorile funcției de distribuție normală și inversul acesteia. Ele sunt încă folosite astăzi, dar este mai eficient să folosiți formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există o formulă gata făcută pentru calcularea intervalului de încredere - ÎNCREDERE.NORMĂ. Sintaxa sa este următoarea.

CONFIDENCE.NORM(alpha;standard_off;size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația adoptată mai sus este egal cu 1- γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 etc.

standard_off– abaterea standard a datelor eșantionului. Nu este nevoie să calculați eroarea standard; Excel însuși va împărți la rădăcina lui n.

mărimea– dimensiunea eșantionului (n).

Rezultatul functiei NORMA DE INCREDERE este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor originale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea de a folosi mostre relativ mari. Cu toate acestea, în era tehnologiei moderne, colectarea cantității necesare de date nu este de obicei dificilă.

Testarea ipotezelor statistice folosind intervale de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Esența sa este pe scurt după cum urmează. Se presupune, de exemplu, că așteptările populației generale sunt egale cu o anumită valoare. Apoi se construiește distribuția mijloacelor eșantionului care pot fi observate pentru o așteptare dată. Apoi, ei analizează unde în această distribuție condiționată se află media reală. Dacă depășește limitele acceptabile, atunci apariția unei astfel de medii este foarte puțin probabilă, iar dacă experimentul se repetă o dată, este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici dovedită!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un anumit eșantion este egală cu 100. Se testează ipoteza că valoarea așteptată este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună așa: poate fi oare asta cu adevăratul valoarea mediei egală cu 90, media observată sa dovedit a fi 100?

Pentru a răspunde la această întrebare, veți avea nevoie în plus de informații despre abaterea standard și dimensiunea eșantionului. Să presupunem că abaterea standard este 30 și numărul de observații este 64 (pentru a extrage cu ușurință rădăcina). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula un interval de încredere de 95%, va trebui să adăugați două erori standard de fiecare parte a mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100±7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuaţiilor aleatorii (cu o probabilitate de 95%). Dacă punctul verificat se încadrează în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Aceasta înseamnă că ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza despre valoarea așteptată este în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui spus: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, ele indică probabilitatea specifică de a respinge eronat ipoteza (nivelul p), și nu nivelul specificat pe care a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, construirea unui interval de încredere pentru medie (sau așteptarea matematică) nu este dificilă. Principalul lucru este să înțelegeți esența, iar apoi lucrurile vor merge mai departe. În practică, cele mai multe cazuri folosesc un interval de încredere de 95%, care este de aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

Inteligența constă nu numai în cunoaștere, ci și în capacitatea de a aplica cunoștințele în practică. (Aristotel)

Intervale de încredere

revizuire generală

Luând un eșantion din populație, obținem o estimare punctuală a parametrului de interes și calculăm eroarea standard pentru a indica precizia estimării.

Cu toate acestea, pentru majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare de interval pentru parametrul populației.

Acest lucru se poate face prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula un interval de încredere (CI - Intervalul de încredere, CI - Intervalul de încredere) pentru parametru.

În general, un interval de încredere extinde estimările în ambele direcții cu un anumit multiplu al erorii standard (a unui parametru dat); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

Interval de încredere pentru medie

Folosind distribuția normală

Media eșantionului este distribuită în mod normal dacă dimensiunea eșantionului este mare, astfel încât să puteți aplica cunoștințele despre distribuția normală atunci când luați în considerare media eșantionului.

Mai exact, 95% din distribuția mediilor eșantionului se află în 1,96 deviații standard (SD) față de media populației.

Când avem doar un eșantion, îl numim eroarea standard a mediei (SEM) și calculăm intervalul de încredere de 95% pentru medie după cum urmează:

Dacă repetăm ​​acest experiment de mai multe ori, intervalul va conține media reală a populației în 95% din timp.

De obicei, acesta este un interval de încredere, cum ar fi intervalul de valori în care se află media reală a populației (media generală) cu o probabilitate de încredere de 95%.

Deși nu este în întregime riguros (media populației este o valoare fixă ​​și, prin urmare, nu poate avea o probabilitate atașată) să interpretăm un interval de încredere în acest fel, este conceptual mai ușor de înțeles.

Utilizare t- distributie

Puteți folosi distribuția normală dacă cunoașteți valoarea varianței în populație. De asemenea, atunci când dimensiunea eșantionului este mică, media eșantionului urmează o distribuție normală dacă datele populației subiacente sunt distribuite în mod normal.

Dacă datele care stau la baza populației nu sunt distribuite în mod normal și/sau varianța populației este necunoscută, media eșantionului se supune Distribuția t a studentului.

Calculăm intervalul de încredere de 95% pentru media populației generale după cum urmează:

Unde este punctul procentual (percentila) t- Distribuția t a lui Student cu (n-1) grade de libertate, care dă o probabilitate cu două fețe de 0,05.

În general, oferă o gamă mai largă decât utilizarea distribuției normale deoarece ia în considerare incertitudinea suplimentară introdusă prin estimarea abaterii standard a populației și/sau datorită dimensiunii reduse a eșantionului.

Când dimensiunea eșantionului este mare (de ordinul a 100 sau mai mult), diferența dintre cele două distribuții ( t-Studentși normal) este nesemnificativă. Cu toate acestea, ele folosesc întotdeauna t- distribuția la calcularea intervalelor de încredere, chiar dacă dimensiunea eșantionului este mare.

De obicei este raportat IC de 95%. Alte intervale de încredere pot fi calculate, cum ar fi IC 99% pentru medie.

În loc de produsul erorii standard și valoarea tabelului t- distribuție, care corespunde unei probabilități cu două fețe de 0,05, înmulțiți-o (eroarea standard) cu valoarea care corespunde unei probabilități cu două fețe de 0,01. Acesta este un interval de încredere mai larg decât intervalul de încredere de 95%, deoarece reflectă o încredere crescută că intervalul include de fapt media populației.

Interval de încredere pentru proporție

Distribuția de eșantionare a proporțiilor are o distribuție binomială. Cu toate acestea, dacă dimensiunea eșantionului n este rezonabil de mare, atunci distribuția de eșantionare a proporției este aproximativ normală cu media .

Evaluăm prin raport selectiv p=r/n(Unde r- numărul de indivizi din eșantion cu trăsăturile caracteristice care ne interesează), iar eroarea standard este estimată:

Intervalul de încredere de 95% pentru proporție este estimat:

Dacă dimensiunea eșantionului este mică (de obicei când n.p. sau n(1-p) Mai puțin 5 ), atunci este necesar să se utilizeze distribuția binomială pentru a calcula intervalele de încredere precise.

Rețineți că dacă p exprimat ca procent, atunci (1-p) inlocuit de (100-p).

Interpretarea intervalelor de încredere

Când interpretăm un interval de încredere, ne interesează următoarele întrebări:

Cât de larg este intervalul de încredere?

Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.

Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, variabilitatea datelor produce intervale de încredere mai largi decât studiile unui set mare de date de câteva variabile. .

CI include valori de interes deosebit?

Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95% șansa este de aproape 5%) ca parametrul să aibă acea valoare.

Una dintre metodele de rezolvare a problemelor statistice este calcularea intervalului de încredere. Este utilizat ca alternativă preferabilă la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere în sine este destul de complex. Dar instrumentele Excel fac oarecum mai ușor. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată pentru estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru efectuarea calculelor folosind această metodă: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule ÎNCREDERE.NORMĂ, iar în al doilea - ADMINISTRATOR.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator ÎNCREDERE.NORMĂ, care aparține grupului statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc analogul său ÎNCREDERE. Scopul acestui operator este de a calcula un interval de încredere distribuit normal pentru media populației.

Sintaxa sa este următoarea:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alfa"— un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard"- Acesta este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Mărimea"— argument care definește dimensiunea eșantionului.

Toate argumentele acestui operator sunt necesare.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_off, dimensiune)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Din motive de compatibilitate, această funcție este lăsată în Excel 2010 și versiunile mai noi într-o categorie specială "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind următoarea formulă:

X+(-)INCREDEREA NORMA

Unde X este valoarea medie a eșantionului, care se află la mijlocul intervalului selectat.

Acum să ne uităm la cum să calculăm un interval de încredere folosind un exemplu specific. Au fost efectuate 12 teste, rezultând rezultate diferite raportate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

  1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Faceți clic pe butonul „Inserare funcție”.
  2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „TRUST.NORM”. După aceea, faceți clic pe butonul "BINE".
  3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
    Plasați cursorul în primul câmp - "Alfa". Aici ar trebui să indicăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

    (1-nivel de încredere)/100

    Adică, înlocuind valoarea, obținem:

    Prin calcule simple aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

    După cum se știe, prin condiție abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" doar notează acest număr.

    În câmp "Mărimea" trebuie să introduceți numărul de elemente de testare efectuate. După cum ne amintim, lor 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când efectuăm un nou test, să setăm această valoare nu cu un număr obișnuit, ci folosind operatorul VERIFICA. Deci, să plasăm cursorul în câmp "Mărimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

    Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA a fost folosit recent de dvs., ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, mergi la subiect „Alte funcții...”.

  4. Apare unul deja familiar Expertul de funcții. Să ne întoarcem din nou la grup "Statistic". Evidențiem numele acolo "VERIFICA". Faceți clic pe butonul "BINE".
  5. Apare fereastra de argument pentru afirmația de mai sus. Această funcție este concepută pentru a calcula numărul de celule dintr-un interval specificat care conțin valori numerice. Sintaxa sa este următoarea:

    COUNT(valoare1,valoare2,...)

    Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. Pot exista până la 255 de astfel de argumente în total, dar în cazul nostru avem nevoie doar de unul.

    Plasați cursorul în câmp „Valoare 1”și, ținând apăsat butonul stâng al mouse-ului, selectați pe foaie gama care conține colecția noastră. Apoi adresa lui va fi afișată în câmp. Faceți clic pe butonul "BINE".

  6. După aceasta, aplicația va efectua calculul și va afișa rezultatul în celula în care se află. În cazul nostru particular, formula arăta astfel:

    NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

    Rezultatul general al calculelor a fost 5,011609 .

  7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea rezultatului calculului din media eșantionului ÎNCREDERE.NORMĂ. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.

    Acest operator este conceput pentru a calcula media aritmetică a unui interval selectat de numere. Are următoarea sintaxă destul de simplă:

    MEDIE(numărul1,numărul2,...)

    Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

    Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

  8. Se deschide Expertul de funcții. Revenind la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul "BINE".
  9. Se deschide fereastra de argumente. Plasați cursorul în câmp "Numărul 1"și ținând apăsat butonul stâng al mouse-ului, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul "BINE".
  10. După care IN MEDIE afișează rezultatul calculului într-un element de foaie.
  11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată și puneți semnul «=» și se adună conținutul elementelor foii în care se află rezultatele calculelor de funcție IN MEDIEȘi ÎNCREDERE.NORMĂ. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:

    Rezultatul calculului: 6,953276

  12. La fel se calculează limita din stânga a intervalului de încredere, doar de data aceasta din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului ÎNCREDERE.NORMĂ. Formula rezultată pentru exemplul nostru este de următorul tip:

    Rezultatul calculului: -3,06994

  13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris în detaliu fiecare formulă. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

    MEDIE(B2:B13)+ÎNCREDERE.NORMĂ(0,03,8,NUMĂRĂ(B2:B13))

  14. Un calcul similar pentru marginea din stânga ar arăta astfel:

    MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția TRUST.STUDENT

În plus, Excel are o altă funcție care este asociată cu calcularea intervalului de încredere - ADMINISTRATOR.STUDENT. A apărut doar în Excel 2010. Acest operator calculează intervalul de încredere al populației folosind distribuția Student. Este foarte convenabil de utilizat atunci când varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

CONFIDENCE.STUDENT(alpha,standard_off,size)

După cum puteți vedea, numele operatorilor au rămas neschimbate în acest caz.

Să vedem cum se calculează limitele unui interval de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Să luăm nivelul de încredere ca ultima dată la 97%.

  1. Selectați celula în care va fi efectuat calculul. Faceți clic pe butonul „Inserare funcție”.
  2. În deschis Expertul de funcții mergi la categorie "Statistic". Selectați un nume „ELEV DE ÎNCREDERE”. Faceți clic pe butonul "BINE".
  3. Se lansează fereastra de argumente pentru operatorul specificat.

    În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . Pentru a doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

    După aceasta, plasați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.V. Pentru a deschide fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol „Alte funcții...”.

  4. Începe Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele în el „STDEV.V”. Apoi faceți clic pe butonul "BINE".
  5. Se deschide fereastra de argumente. Sarcina operatorului STDEV.V este de a determina abaterea standard a unei probe. Sintaxa sa arată astfel:

    DEVIARE STANDARD.B(număr1;număr2;…)

    Nu este greu de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci puteți utiliza un singur argument pentru a furniza o legătură către acest interval.

    Plasați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați colecția. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul "BINE", deoarece rezultatul va fi incorect. Mai întâi trebuie să ne întoarcem la fereastra de argumente operator ADMINISTRATOR.STUDENT pentru a adăuga argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

  6. Fereastra de argumente pentru funcția deja familiară se deschide din nou. Plasați cursorul în câmp "Mărimea". Din nou, faceți clic pe triunghiul cu care suntem deja familiarizați pentru a merge la selecția operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
  7. Odată în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul "BINE".
  8. După aceasta, programul efectuează un calcul și afișează valoarea intervalului de încredere.
  9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
  10. Însumarea rezultatelor calculului IN MEDIEȘi ADMINISTRATOR.STUDENT, obținem limita dreaptă a intervalului de încredere.
  11. Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ADMINISTRATOR.STUDENT, avem limita din stânga a intervalului de încredere.
  12. Dacă calculul este scris într-o singură formulă, atunci calculul limitei drepte în cazul nostru va arăta astfel:

    MEDIE(B2:B13)+ÎNCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

  13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

    MEDIE(B2:B13)-INCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

După cum puteți vedea, instrumentele Excel facilitează calcularea intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

Interval de încredere(CI; în engleză, interval de încredere - CI) obținut într-un studiu cu un eșantion oferă o măsură a acurateței (sau incertitudinii) rezultatelor studiului pentru a trage concluzii despre populația tuturor acestor pacienți (populația generală). Definiția corectă a unui CI de 95% poate fi formulată astfel: 95% dintre astfel de intervale vor conține valoarea adevărată în populație. Această interpretare este oarecum mai puțin precisă: CI este intervalul de valori în care puteți fi 95% sigur că conține valoarea adevărată. Când se utilizează un CI, se pune accent pe determinarea unui efect cantitativ, spre deosebire de valoarea P care rezultă din testarea semnificației statistice. Valoarea P nu estimează nicio cantitate, ci servește mai degrabă ca o măsură a puterii dovezilor față de ipoteza nulă a „fără efect”. Valoarea lui P în sine nu ne spune nimic despre mărimea diferenței sau chiar despre direcția acesteia. Prin urmare, valorile P independente sunt absolut neinformative în articole sau rezumate. În schimb, IC indică atât dimensiunea efectului de interes imediat, cum ar fi beneficiul unui tratament, cât și puterea dovezilor. Prin urmare, DI este direct legată de practica EBM.

Abordarea estimativă a analizei statistice, exemplificată prin CI, urmărește măsurarea cantității unui efect de interes (sensibilitatea unui test de diagnostic, rata cazurilor prezise, ​​reducerea riscului relativ cu tratament etc.) și, de asemenea, măsurarea incertitudinii în acest sens. efect. Cel mai adesea, CI este intervalul de valori de ambele părți ale estimării în care se află probabil valoarea adevărată și puteți fi 95% sigur de aceasta. Acordul de utilizare a probabilității de 95% este arbitrar, la fel ca și valoarea P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI se bazează pe ideea că același studiu efectuat pe eșantioane diferite de pacienți nu ar produce rezultate identice, ci că rezultatele acestora ar fi distribuite în jurul unei valori adevărate, dar necunoscute. Cu alte cuvinte, CI îl descrie drept „variabilitate dependentă de eșantion”. CI nu reflectă incertitudine suplimentară din alte motive; în special, nu include impactul pierderii selective în urmărire, conformarea slabă sau măsurarea inexactă a rezultatului, lipsa orbirii etc. Prin urmare, IC subestimează întotdeauna cantitatea totală de incertitudine.

Calcul intervalului de încredere

Tabelul A1.1. Erori standard și intervale de încredere pentru măsurătorile clinice selectate

De obicei, un CI este calculat dintr-o estimare observată a unei cantități, cum ar fi diferența (d) dintre două proporții și eroarea standard (SE) în estimarea acelei diferențe. CI de aproximativ 95% obținut în acest mod este d ± 1,96 SE. Formula se modifică în funcție de natura măsurării rezultatului și de domeniul de aplicare al CI. De exemplu, într-un studiu randomizat, controlat cu placebo, al unui vaccin acelular împotriva pertussis, 72 din 1670 (4,3%) sugari care au primit vaccinul au dezvoltat pertussis și 240 din 1665 (14,4%) în grupul de control. Diferența procentuală, cunoscută sub numele de reducerea absolută a riscului, este de 10,1%. SE a acestei diferențe este de 0,99%. În consecință, IC de 95% este 10,1% + 1,96 x 0,99%, i.e. de la 8.2 la 12.0.

În ciuda abordărilor lor filozofice diferite, CI și testele de semnificație statistică sunt strâns legate din punct de vedere matematic.

Astfel, valoarea P este „semnificativă”, adică. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Incertitudinea (inecizia) estimării, exprimată în CI, este în mare măsură legată de rădăcina pătrată a dimensiunii eșantionului. Eșantioanele mici oferă mai puține informații decât cele mari, iar CI este în mod corespunzător mai larg într-un eșantion mai mic. De exemplu, un articol care compară performanța a trei teste utilizate pentru a diagnostica infecția cu Helicobacter pylori a raportat o sensibilitate a testului respirator cu uree de 95,8% (95% CI 75-100). În timp ce cifra de 95,8% este impresionantă, eșantionul mic de 24 de pacienți adulți cu J. pylori înseamnă că există o incertitudine semnificativă în această estimare, așa cum arată IC larg. Într-adevăr, limita inferioară de 75% este mult mai mică decât estimarea de 95,8%. Dacă s-ar observa aceeași sensibilitate la un eșantion de 240 de persoane, IC de 95% ar fi 92,5-98,0, oferind mai multă siguranță că testul este foarte sensibil.

În studiile randomizate controlate (RCT), rezultatele nesemnificative (adică cele cu P > 0,05) sunt deosebit de susceptibile de interpretare greșită. CI este deosebit de util aici, deoarece arată cât de consistente sunt rezultatele cu efectul real util din punct de vedere clinic. De exemplu, într-un RCT care compară sutura colonică și anastomoza cu capse, infecția plăgii s-a dezvoltat la 10,9% și, respectiv, 13,5% dintre pacienți (P = 0,30). CI de 95% pentru această diferență este de 2,6% (de la -2 la +8). Chiar și în acest studiu pe 652 de pacienți, rămâne posibil să existe o diferență modestă în incidența infecțiilor rezultate din cele două proceduri. Cu cât mai puține cercetări, cu atât este mai mare incertitudinea. Sung și colab. a efectuat un RCT pentru a compara perfuzia de octreotidă cu scleroterapia acută pentru sângerare variceală acută la 100 de pacienți. În grupul cu octreotidă, rata de control a sângerării a fost de 84%; în grupul de scleroterapie - 90%, ceea ce dă P = 0,56. Rețineți că ratele de sângerare în curs sunt similare cu cele pentru infecția rănilor din studiul menționat. În acest caz, totuși, IC de 95% pentru diferența dintre intervenții este de 6% (-7 până la +19). Acest interval este destul de larg în comparație cu diferența de 5% care ar fi de interes clinic. În mod clar, studiul nu exclude o diferență semnificativă de eficacitate. Prin urmare, concluzia autorilor „infuzia de octreotidă și scleroterapia sunt la fel de eficiente în tratamentul sângerării din vene varicoase” este cu siguranță invalidă. În astfel de cazuri, în care, ca și aici, IC de 95% pentru reducerea riscului absolut (ARR) include zero, IC pentru NNT (număr necesar pentru tratare) este destul de dificil de interpretat. NPL și CI se obțin din reciprocele ACP (înmulțind cu 100 dacă aceste valori sunt date ca procente). Aici obținem NPL = 100: 6 = 16,6 cu un CI de 95% de la -14,3 la 5,3. După cum se poate vedea din nota de subsol „d” din tabel. A1.1, acest CI include valorile NPL de la 5,3 la infinit și NPL de la 14,3 la infinit.

CI pot fi construite pentru cele mai utilizate estimări sau comparații statistice. Pentru RCT, include diferența dintre proporțiile medii, riscurile relative, cotele de cote și NLR. În mod similar, CI pot fi obținute pentru toate estimările majore făcute în studiile de acuratețe a testelor de diagnosticare - sensibilitate, specificitate, valoare predictivă pozitivă (toate fiind proporții simple) și rapoarte de probabilitate - estimări obținute în meta-analize și în comparație cu controlul studii. Un program de calculator personal care acoperă multe dintre aceste utilizări ale MDI-urilor este disponibil cu a doua ediție a Statistics with Confidence. Macro-urile pentru calcularea CI pentru proporții sunt disponibile gratuit pentru Excel și programele statistice SPSS și Minitab la http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Estimări multiple ale efectului tratamentului

Deși CI sunt de dorit pentru rezultatele studiului primar, ele nu sunt necesare pentru toate rezultatele. CI se referă la comparații importante din punct de vedere clinic. De exemplu, când se compară două grupuri, CI corect este cel construit pentru diferența dintre grupuri, așa cum se arată în exemplele de mai sus, și nu CI care poate fi construit pentru estimarea în fiecare grup. Nu numai că nu este util să furnizați CI separate pentru estimări în fiecare grup, dar această prezentare poate induce în eroare. În mod similar, abordarea corectă atunci când se compară eficacitatea tratamentelor în diferite subgrupuri este de a compara direct două (sau mai multe) subgrupuri. Este incorect să presupunem că un tratament este eficient într-un singur subgrup dacă CI exclude valoarea corespunzătoare fără efect, iar celelalte nu. CI sunt utile și atunci când se compară rezultatele din mai multe subgrupuri. În fig. A 1.1 arată riscul relativ de eclampsie la femeile cu preeclampsie în subgrupuri de femei dintr-un RCT controlat cu placebo de sulfat de magneziu.

Orez. A1.2. Graficul forestier arată rezultatele a 11 studii clinice randomizate ale vaccinului cu rotavirus bovin pentru prevenirea diareei în comparație cu placebo. Un interval de încredere de 95% a fost utilizat pentru a estima riscul relativ de diaree. Dimensiunea pătratului negru este proporțională cu cantitatea de informații. În plus, sunt prezentate estimarea sumar a eficacității tratamentului și intervalul de încredere de 95% (indicat cu un romb). Meta-analiza a folosit un model de efecte aleatoare mai mare decât unele prespecificate; de exemplu, aceasta ar putea fi dimensiunea utilizată la calcularea mărimii eșantionului. Un criteriu mai strict necesită ca întregul interval CI să prezinte beneficii mai mari decât un minim prespecificat.

Am discutat deja eroarea de a lua o lipsă de semnificație statistică ca un indiciu că două tratamente sunt la fel de eficiente. Este la fel de important să nu echivalăm semnificația statistică cu importanța clinică. Importanța clinică poate fi asumată atunci când rezultatul este semnificativ statistic și amploarea estimării eficacității tratamentului

Studiile pot arăta dacă rezultatele sunt semnificative din punct de vedere statistic și care sunt importante din punct de vedere clinic și care nu. În fig. A1.2 arată rezultatele a patru teste, pentru care întregul CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.