Definiți o serie de variații. Serii de variații și variații, domeniul de aplicare a variației

Serii de variații: definiție, tipuri, caracteristici principale. Metoda de calcul
mod, mediană, medie aritmetică în cercetarea medicală și statistică
(arata cu un exemplu conditionat).

O serie de variații este o serie de valori numerice ale caracteristicii studiate, care diferă unele de altele ca mărime și dispuse într-o anumită succesiune (în ordine crescătoare sau descrescătoare). Fiecare valoare numerică a unei serii se numește variantă (V), iar numerele care arată cât de des apare o anumită variantă într-o serie dată se numesc frecvență (p).

Numărul total de cazuri de observație care compun seria de variații este notat cu litera n. Diferența de semnificație a caracteristicilor studiate se numește variație. Dacă o caracteristică variabilă nu are o măsură cantitativă, variația se numește calitativă, iar seria de distribuție este numită atributivă (de exemplu, distribuția după rezultatul bolii, starea de sănătate etc.).

Dacă o caracteristică variabilă are o expresie cantitativă, o astfel de variație se numește cantitativă, iar seria de distribuție se numește variațională.

Serii de variații sunt împărțite în discontinue și continue - în funcție de natura caracteristicii cantitative; simple și ponderate - în funcție de frecvența de apariție a variantei.

Într-o serie de variații simple, fiecare opțiune apare o singură dată (p=1), într-o serie ponderată, aceeași opțiune apare de mai multe ori (p>1). Exemple de astfel de serii vor fi discutate în continuare în text. Dacă caracteristica cantitativă este continuă, i.e. Între mărimile întregi există mărimi fracționale intermediare; seria de variații se numește continuă.

De exemplu: 10.0 – 11.9

14,0 – 15,9 etc.

Dacă caracteristica cantitativă este discontinuă, i.e. valorile sale individuale (variantele) diferă între ele printr-un număr întreg și nu au valori fracționale intermediare; seria de variații se numește discontinuă sau discretă.

Folosind datele privind ritmul cardiac din exemplul anterior

pentru 21 de elevi, vom construi o serie de variații (Tabelul 1).

tabelul 1

Distribuția studenților la medicină în funcție de frecvența cardiacă (bpm)

Astfel, a construi o serie de variații înseamnă a sistematiza și organiza valorile numerice disponibile (variante), adică. aranjați într-o anumită succesiune (în ordine crescătoare sau descrescătoare) cu frecvențele corespunzătoare. În exemplul luat în considerare, opțiunile sunt aranjate în ordine crescătoare și exprimate ca numere întregi discontinue (discrete), fiecare opțiune apare de mai multe ori, i.e. avem de-a face cu o serie de variații ponderate, discontinue sau discrete.

De regulă, dacă numărul de observații din populația statistică pe care o studiem nu depășește 30, atunci este suficient să aranjam toate valorile caracteristicii studiate într-o serie de variații crescătoare, ca în tabel. 1, sau ordine descrescătoare.

Cu un număr mare de observații (n>30), numărul de variante care apar poate fi foarte mare; în acest caz, se alcătuiește un interval sau o serie de variații grupate, în care, pentru a simplifica prelucrarea ulterioară și a clarifica natura distribuției, variantele sunt combinate în grupuri.

De obicei, numărul de opțiuni de grup variază de la 8 la 15.

Ar trebui să fie cel puțin 5, pentru că... în caz contrar, va fi o mărire prea aspră, excesivă, care distorsionează imaginea generală a variației și afectează foarte mult acuratețea valorilor medii. Când numărul de variante de grup este mai mare de 20-25, acuratețea calculării valorilor medii crește, dar caracteristicile variației caracteristicii sunt semnificativ distorsionate și procesarea matematică devine mai complicată.

La compilarea unei serii grupate, este necesar să se țină cont

− grupurile de opțiuni trebuie aranjate într-o anumită ordine (crescător sau descrescător);

− intervalele în grupurile de opțiuni trebuie să fie aceleași;

− valorile limitelor intervalului nu trebuie să coincidă, deoarece nu va fi clar în ce grupuri să clasificați variantele individuale;

− este necesar să se țină cont de caracteristicile calitative ale materialului colectat la stabilirea limitelor de interval (de exemplu, la studierea greutății adulților, este acceptabil un interval de 3-4 kg, iar pentru copiii din primele luni de viață este nu trebuie să depășească 100 g)

Să construim o serie grupată (interval) care caracterizează datele privind frecvența pulsului (bătăi pe minut) pentru 55 de studenți la medicină înainte de examen: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Pentru a construi o serie grupată aveți nevoie de:

1. Determinați dimensiunea intervalului;

2. Determinați mijlocul, începutul și sfârșitul grupelor din seria de variații.

● Mărimea intervalului (i) este determinată de numărul de presupuse grupuri (r), al căror număr este stabilit în funcție de numărul de observații (n) conform unui tabel special

Numărul de grupuri în funcție de numărul de observații:

În cazul nostru, pentru 55 de studenți, puteți crea de la 8 la 10 grupuri.

Valoarea intervalului (i) este determinată de următoarea formulă -

i = V max-V min/r

În exemplul nostru, valoarea intervalului este 82-58/8= 3.

Dacă valoarea intervalului este o fracție, rezultatul trebuie rotunjit la cel mai apropiat număr întreg.

Există mai multe tipuri de medii:

● medie aritmetică,

● medie geometrică,

● medie armonică,

● rădăcină medie pătrată,

● medie progresivă,

● mediană

În statistica medicală, mediile aritmetice sunt cel mai des folosite.

Media aritmetică (M) este o valoare generalizantă care determină ceea ce este tipic pentru întreaga populație. Principalele metode de calcul a lui M sunt: ​​metoda mediei aritmetice și metoda momentelor (abaterile condiționate).

Metoda mediei aritmetice este utilizată pentru a calcula media aritmetică simplă și media aritmetică ponderată. Alegerea metodei de calcul a mediei aritmetice depinde de tipul seriei de variații. În cazul unei serii de variații simple, în care fiecare opțiune apare o singură dată, media aritmetică simplă este determinată de formula:

unde: M – valoarea medie aritmetică;

V – valoarea caracteristicii variabile (variante);

Σ – indică acțiunea – însumare;

n – numărul total de observații.

Un exemplu de calcul al mediei aritmetice simple. Frecvența respiratorie (numărul de mișcări respiratorii pe minut) la 9 bărbați cu vârsta de 35 de ani: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Pentru a determina nivelul mediu al frecvenței respiratorii la bărbații în vârstă de 35 de ani, este necesar:

1. Construiți o serie de variații, aranjand toate opțiunile în ordine crescătoare sau descrescătoare Am obținut o serie de variații simplă, deoarece valorile opțiunilor apar o singură dată.

M = ∑V/n = 171/9 = 19 respirații pe minut

Concluzie. Frecvența respiratorie la bărbații în vârstă de 35 de ani este în medie de 19 mișcări respiratorii pe minut.

Dacă valorile individuale ale unei variante sunt repetate, nu este nevoie să scrieți fiecare variantă într-o linie; este suficient să enumerați dimensiunile care apar ale variantei (V) și lângă aceasta să indicați numărul repetărilor lor (p ). O astfel de serie de variații, în care opțiunile sunt, parcă, cântărite de numărul de frecvențe care le corespund, se numește serie de variații ponderate, iar valoarea medie calculată este media aritmetică ponderată.

Media aritmetică ponderată este determinată de formula: M= ∑Vp/n

unde n este numărul de observații egal cu suma frecvențelor – Σр.

Un exemplu de calcul a mediei ponderate aritmetice.

Durata invalidității (în zile) la 35 de pacienți cu afecțiuni respiratorii acute (IRA) tratați de un medic local în primul trimestru al anului curent a fost: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 zile .

Metoda de determinare a duratei medii a dizabilității la pacienții cu infecții respiratorii acute este următoarea:

1. Să construim o serie de variații ponderate, deoarece Valorile individuale ale opțiunii sunt repetate de mai multe ori. Pentru a face acest lucru, puteți aranja toate opțiunile în ordine crescătoare sau descrescătoare cu frecvențele corespunzătoare.

În cazul nostru, opțiunile sunt aranjate în ordine crescătoare

2. Calculați media ponderată aritmetică folosind formula: M = ∑Vp/n = 233/35 = 6,7 zile

Distribuția pacienților cu infecții respiratorii acute în funcție de durata dizabilității:

Durata handicapului (V) Număr de pacienți (p) Vp
∑p = n = 35 ∑Vp = 233

Concluzie. Durata dizabilității la pacienții cu boli respiratorii acute a fost în medie de 6,7 zile.

Modul (Mo) este cea mai comună opțiune din seria de variații. Pentru distribuția prezentată în tabel, modul corespunde unei opțiuni egale cu 10; apare mai des decât altele - de 6 ori.

Distribuția pacienților după durata șederii într-un pat de spital (în zile)

V
p

Uneori este dificil de determinat magnitudinea exactă a unui mod, deoarece pot exista câteva observații „cele mai frecvente” în datele studiate.

Mediana (Me) este un indicator neparametric care împarte seria de variații în două jumătăți egale: același număr de variante este situat de ambele părți ale medianei.

De exemplu, pentru distribuția prezentată în tabel, mediana este 10, deoarece pe ambele părți ale acestei valori există 14 opțiuni, adică numărul 10 ocupă o poziție centrală în această serie și este mediana acestuia.

Având în vedere că numărul de observații din acest exemplu este par (n=34), mediana poate fi determinată după cum urmează:

Eu = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Aceasta înseamnă că mijlocul seriei cade pe a șaptesprezecea opțiune, care corespunde unei mediane egale cu 10. Pentru distribuția prezentată în tabel, media aritmetică este egală cu:

M = ∑Vp/n = 334/34 = 10,1

Deci, pentru 34 de observații din tabel. 8, avem: Mo=10, Me=10, media aritmetică (M) este 10,1. În exemplul nostru, toți cei trei indicatori s-au dovedit a fi egali sau apropiați unul de celălalt, deși sunt complet diferiți.

Media aritmetică este suma rezultată a tuturor influențelor; la formarea acestuia iau parte toate opțiunile fără excepție, inclusiv cele extreme, adesea atipice pentru un anumit fenomen sau populație.

Modul și mediana, spre deosebire de media aritmetică, nu depind de valoarea tuturor valorilor individuale ale caracteristicii variabile (valorile variantelor extreme și gradul de dispersie a seriei). Media aritmetică caracterizează întreaga masă de observații, modul și mediana caracterizează volumul

Metoda de grupare vă permite, de asemenea, să măsurați variație(variabilitate, fluctuație) semnelor. Când numărul de unități dintr-o populație este relativ mic, variația este măsurată pe baza numărului clasat de unități care alcătuiesc populația. Serialul se numește clasat, dacă unităţile sunt dispuse în ordinea crescătoare (descrescătoare) a caracteristicii.

Cu toate acestea, seriile clasificate sunt destul de indicative atunci când este necesară o caracteristică comparativă a variației. În plus, în multe cazuri avem de-a face cu populații statistice formate dintr-un număr mare de unități, care sunt practic greu de reprezentat sub forma unei serii specifice. În acest sens, pentru o primă cunoaștere generală a datelor statistice și mai ales pentru a facilita studiul variației caracteristicilor, fenomenele și procesele studiate sunt de obicei combinate în grupuri, iar rezultatele grupării sunt prezentate sub formă de tabele de grup.

Dacă un tabel de grup are doar două coloane - grupuri după o caracteristică selectată (opțiuni) și numărul de grupuri (frecvență sau frecvență), se numește aproape de distribuție.

Interval de distribuție - cel mai simplu tip de grupare structurală bazată pe o caracteristică, afișată într-un tabel de grup cu două coloane care conțin variante și frecvențe ale caracteristicii. În multe cazuri, cu o astfel de grupare structurală, i.e. Odată cu compilarea seriilor de distribuție începe studiul materialului statistic inițial.

O grupare structurală sub forma unei serii de distribuție poate fi transformată într-o veritabilă grupare structurală dacă grupurile selectate sunt caracterizate nu numai prin frecvențe, ci și prin alți indicatori statistici. Scopul principal al seriei de distribuție este de a studia variația caracteristicilor. Teoria distribuției seriilor este dezvoltată în detaliu prin statistici matematice.

Serii de distribuție sunt împărțite în atributiv(gruparea în funcție de caracteristicile atributive, de exemplu, împărțirea populației pe gen, naționalitate, stare civilă etc.) și variațională(gruparea după caracteristici cantitative).

Seria de variații este un tabel de grup care conține două coloane: gruparea unităților în funcție de o caracteristică cantitativă și numărul de unități din fiecare grupă. Intervalele din seria de variații sunt de obicei formate egale și închise. Seria de variații este următoarea grupare a populației ruse după venitul monetar mediu pe cap de locuitor (Tabelul 3.10).

Tabelul 3.10

Distribuția populației Rusiei în funcție de venitul mediu pe cap de locuitor în perioada 2004-2009.

Grupuri de populație după venitul mediu pe cap de locuitor, rub./lună

Populația din grup, % din total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Peste 25.000,0

Întreaga populație

Serii de variații, la rândul lor, sunt împărțite în discrete și interval. Discret serii de variații combină variante de caracteristici discrete care variază în limite înguste. Un exemplu de serie de variații discrete este distribuția familiilor rusești după numărul de copii pe care îi au.

Interval serii de variații combină variante fie ale caracteristicilor continue, fie ale caracteristicilor discrete care variază într-o gamă largă. Intervalul este seria de variații a distribuției populației ruse în funcție de venitul monetar mediu pe cap de locuitor.

Serii de variații discrete nu sunt folosite foarte des în practică. Între timp, compilarea lor nu este dificilă, întrucât componența grupurilor este determinată de variantele specifice pe care le posedă de fapt caracteristicile grupării studiate.

Serii de variații de intervale sunt mai răspândite. La compilarea acestora, apare o întrebare dificilă cu privire la numărul de grupuri, precum și la dimensiunea intervalelor care ar trebui stabilite.

Principiile pentru rezolvarea acestei probleme sunt expuse în capitolul privind metodologia de construire a grupărilor statistice (vezi paragraful 3.3).

Seriile de variații sunt un mijloc de colaps sau comprimare a diverselor informații într-o formă compactă; din ele se poate face o judecată destul de clară asupra naturii variației și se poate studia diferențele dintre caracteristicile fenomenelor incluse în setul studiat. Dar cea mai importantă semnificație a seriei de variații este aceea că pe baza lor sunt calculate caracteristicile de generalizare speciale ale variației (vezi capitolul 7).

Variația determină diferențe în valorile unei caracteristici între diferite unități ale unei populații date în aceeași perioadă (punct în timp). Variația este cauzată de condiții diferite de existență a diferitelor unități ale populației. De exemplu, chiar și gemenii în cursul vieții dobândesc diferențe de înălțime, greutate, precum și în caracteristici precum nivelul de educație, venitul, numărul de copii etc.

Variația apare ca urmare a faptului că valorile atributului în sine sunt formate sub influența totală a diferitelor condiții, care sunt combinate în moduri diferite în fiecare caz individual. Astfel, valoarea oricărei opțiuni este obiectivă.

Variația este caracteristică la toate fenomenele naturii și societății, fără excepție, cu excepția sensurilor normative stabilite legal ale caracteristicilor sociale individuale. Studiile de variație în statistică sunt de mare importanță; ele ajută la înțelegerea esenței fenomenului studiat. Găsirea variației, aflarea cauzelor acesteia, identificarea influenței factorilor individuali oferă informații importante pentru implementarea deciziilor de management bazate științific.

Valoarea medie dă o caracteristică generalizată a caracteristicii populației, dar nu dezvăluie structura acesteia. Valoarea medie nu arată cum sunt situate variantele caracteristicii medii în jurul acesteia, indiferent dacă sunt distribuite în apropierea mediei sau se abat de la aceasta. Media la două populații poate fi aceeași, dar într-o versiune toate valorile individuale diferă de aceasta în mod nesemnificativ, iar în cealaltă, aceste diferențe sunt mari, adică. în primul caz, variația caracteristicii este mică, iar în al doilea este mare; acest lucru este foarte important pentru caracterizarea semnificației valorii medii.

Pentru ca șeful unei organizații, un manager sau un cercetător să studieze variația și să o gestioneze, statistica a dezvoltat metode speciale de studiere a variației (un sistem de indicatori). Cu ajutorul lor, se găsește variația și se caracterizează proprietățile acesteia. Indicatorii de variație includ : interval de variație, abatere liniară medie, coeficient de variație.

Seria de variații și formele sale

Seria de variații- aceasta este o distribuție ordonată a unităților unei populații, adesea în funcție de valori crescătoare (mai rar descrescătoare) ale unei caracteristici și numărând numărul de unități cu o anumită valoare a caracteristicii. Când numărul de unități de populație este mare, seria clasată devine greoaie și construcția ei durează mult. Într-o astfel de situație, se construiește o serie de variații prin gruparea unităților populației în funcție de valorile caracteristicii studiate.

Există următoarele forme de serie de variații :

  1. Serii clasate reprezintă o listă a unităţilor individuale ale populaţiei în ordine crescătoare (descrescătoare) a caracteristicii studiate.
  2. Serii de variații discrete - acesta este un tabel format din două linii sau grafice: valori specifice ale caracteristicii variabile x și numărul de unități ale populației cu o valoare dată f - caracteristica frecvenței. Este construit atunci când atributul ia cel mai mare număr de valori.
  3. Serii de intervale.

Gama de variație este determinată ca valoare absolută a diferenței dintre valorile (variantele) maxime și minime ale caracteristicii:

Gama de variație arată doar abateri extreme ale caracteristicii și nu reflectă abaterile individuale ale tuturor opțiunilor din serie. Caracterizează limitele schimbării într-o caracteristică variabilă și depinde de fluctuațiile a două opțiuni extreme și nu este absolut legată de frecvențele din seria de variații, adică de natura distribuției, ceea ce conferă acestei valori un caracter aleatoriu. Pentru a analiza variația, aveți nevoie de un indicator care să reflecte toate fluctuațiile caracteristicii de variație și să ofere o caracteristică generală. Cel mai simplu indicator de acest tip este deviația liniară medie.

Seria de variații este o serie de valori numerice ale unei caracteristici.

Principalele caracteristici ale seriei de variații: v – variantă, p – frecvența apariției acesteia.

Tipuri de serie de variații:

    în funcție de frecvența de apariție a opțiunilor: simplă - opțiunea apare o dată, ponderată - opțiunea apare de două sau de mai multe ori;

    după locația opțiunilor: clasate - opțiunile sunt aranjate în ordine descrescătoare și crescătoare, neclasate - opțiunile sunt scrise fără o ordine anume;

    prin combinarea unei opțiuni în grupuri: grupate - opțiunile sunt combinate în grupuri, negrupate - opțiunile nu sunt combinate în grupuri;

    opțiuni după dimensiune: continuu - opțiunile sunt exprimate ca număr întreg și fracționar, discrete - opțiunile sunt exprimate ca număr întreg, complexe - opțiunile sunt reprezentate printr-o valoare relativă sau medie.

O serie de variații este compilată și formalizată în scopul calculării valorilor medii.

Formular de înregistrare a seriei de variații:

8. Valori medii, tipuri, metode de calcul, aplicare în sănătate

Valori medii– o caracteristică generalizantă cumulativă a caracteristicilor cantitative. Aplicarea mediilor:

1. Să caracterizeze organizarea muncii instituțiilor medicale și să evalueze activitățile acestora:

a) în clinică: indicatori ai volumului de muncă al medicilor, numărul mediu de vizite, numărul mediu de rezidenți din zonă;

b) într-un spital: numărul mediu de zile în care un pat este deschis pe an; durata medie de spitalizare;

c) în centrul igienei, epidemiologiei și sănătății publice: suprafața medie (sau capacitatea cubică) pe persoană, standardele medii de nutriție (proteine, grăsimi, glucide, vitamine, săruri minerale, calorii), norme și standarde sanitare etc.;

2. Să caracterizeze dezvoltarea fizică (principalele caracteristici antropometrice, morfologice și funcționale);

3. Să determine parametrii medicali și fiziologici ai organismului în condiții normale și patologice în studii clinice și experimentale.

4. În cercetarea științifică specială.

Diferența dintre valorile medii și indicatori:

1. Coeficienții caracterizează o caracteristică alternativă care apare doar într-o anumită parte a populației statistice, care poate să apară sau nu.

Valorile medii acoperă caracteristici comune tuturor membrilor echipei, dar în grade diferite (greutate, înălțime, zile de tratament în spital).

2. Coeficienții sunt utilizați pentru măsurarea caracteristicilor calitative. Valori medii – pentru diferite caracteristici cantitative.

Tipuri de medii:

    media aritmetică, caracteristicile sale sunt abaterea standard și eroarea medie

    mod și mediană. Moda (lună)– corespunde valorii caracteristicii care apare mai des decât altele într-o anumită populație. Mediană (eu)– valoarea unei caracteristici care ocupă valoarea mediană într-o populație dată. Împarte seria în 2 părți egale în funcție de numărul de observații. Media aritmetică (M)– spre deosebire de mod și mediană, se bazează pe toate observațiile făcute, prin urmare este o caracteristică importantă pentru întreaga distribuție.

    alte tipuri de medii care sunt utilizate în studiile speciale: rădăcină medie pătrată, cubică, armonică, geometrică, progresivă.

Media aritmetică caracterizează nivelul mediu al populaţiei statistice.

Pentru o serie simplă, unde

∑v – opțiune de sumă,

n – numărul de observații.

pentru o serie ponderată, unde

∑vр – suma produselor fiecărei opțiuni și frecvența apariției acesteia

n – numărul de observații.

Deviație standard media aritmetică sau sigma (σ) caracterizează diversitatea unei caracteristici

- pentru un simplu rând

Σd 2 – suma pătratelor diferenței dintre media aritmetică și fiecare opțiune (d = │M-V│)

n – numărul de observații

- pentru un rând cântărit

∑d 2 p – suma produselor pătratelor diferenței dintre media aritmetică și fiecare opțiune și frecvența apariției acesteia,

n – numărul de observații.

Gradul de diversitate poate fi judecat după mărimea coeficientului de variație
. Mai mult de 20% este o diversitate puternică, 10-20% este o diversitate medie, mai puțin de 10% este o diversitate slabă.

Dacă adunăm și scădem o sigma (M ± 1σ) la valoarea medie aritmetică, atunci cu o distribuție normală, cel puțin 68,3% din toate variantele (observațiile) se vor încadra în aceste limite, ceea ce este considerat norma pentru fenomenul studiat. . Dacă k 2 ± 2σ, atunci 95,5% din toate observațiile vor fi în aceste limite, iar dacă k M ± 3σ, atunci 99,7% din toate observațiile vor fi în aceste limite. Astfel, abaterea standard este o abatere standard care ne permite să anticipăm probabilitatea apariției unei astfel de valori a caracteristicii studiate care se află în limitele specificate.

Eroarea medie a mediei aritmetice sau părtinire de reprezentativitate. Pentru o serie simplă, ponderată și regula momentelor:

.

Pentru a calcula valorile medii, este necesar: omogenitatea materialului, un număr suficient de observații. Dacă numărul de observații este mai mic de 30, n-1 este utilizat în formulele pentru calcularea σ și m.

La evaluarea rezultatului obținut prin mărimea erorii medii, se utilizează un coeficient de încredere, care face posibilă determinarea probabilității unui răspuns corect, adică indică faptul că valoarea rezultată a erorii de eșantionare nu va fi mai mare decât eroarea reală făcută ca urmare a observației continue. În consecință, odată cu creșterea probabilității de încredere, lățimea intervalului de încredere crește, ceea ce, la rândul său, crește încrederea judecății și suportabilitatea rezultatului obținut.

Serii de distribuție statistică– aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de o anumită caracteristică variabilă.
În funcție de caracteristica care stă la baza formării seriei de distribuție, există serii de distribuţie atributivă şi variaţională.

Prezența unei caracteristici comune stă la baza formării unei populații statistice, care reprezintă rezultatele descrierii sau măsurării caracteristicilor generale ale obiectelor de studiu.

Subiectul de studiu în statistică este schimbarea (variantă) caracteristici sau caracteristici statistice.

Tipuri de caracteristici statistice.

Seriile de distribuție sunt numite atributive construit după criterii de calitate. Atributiv– acesta este un semn care are un nume (de exemplu, profesie: croitoreasă, profesor etc.).
Seria de distribuție este de obicei prezentată sub formă de tabele. În tabel 2.8 prezintă seria de distribuție a atributelor.
Tabelul 2.8 - Distribuția tipurilor de asistență juridică oferite de avocați cetățenilor uneia dintre regiunile Federației Ruse.

Seria de variații– acestea sunt valorile caracteristicii (sau intervalele de valori) și frecvențele acestora.
Serii de variații sunt serii de distribuție, construit pe o bază cantitativă. Orice serie de variații constă din două elemente: opțiuni și frecvențe.
Variantele sunt considerate a fi valorile individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații.
Frecvențele sunt numerele de variante individuale sau fiecare grup al unei serii de variații, adică Acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia.
Frecvențele sunt frecvențe exprimate ca fracții dintr-o unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%. Seria de variații permite estimarea formei legii de distribuție pe baza datelor reale.

În funcție de natura variației trăsăturii, există serie de variații discrete și interval.
Un exemplu de serie de variații discrete este dat în tabel. 2.9.
Tabelul 2.9 - Distribuția familiilor după numărul de camere ocupate în apartamente individuale în 1989 în Federația Rusă.

Prima coloană a tabelului prezintă opțiuni pentru o serie de variații discrete, a doua coloană conține frecvențele seriei de variații, iar a treia conține indicatori de frecvență.

Seria de variații

O anumită caracteristică cantitativă este studiată în populația generală. Din el se extrage aleatoriu o mostră de volum n, adică numărul elementelor eșantionului este egal cu n. În prima etapă a procesării statistice, variind mostre, adică ordonarea numerelor x 1 , x 2 , …, x n Ascendent. Fiecare valoare observată x i numit opțiune. Frecvență m i este numărul de observații ale valorii x iîn probă. Frecvența relativă (frecvența) w i este raportul de frecvență m i la dimensiunea eșantionului n: .
Când se studiază serii de variații, se folosesc și conceptele de frecvență acumulată și frecvență acumulată. Lăsa X oarecare număr. Apoi numărul de opțiuni , ale căror valori sunt mai mici X, se numește frecvență acumulată: pentru x i n se numeste frecventa acumulata w i max.
O caracteristică se numește variabilă discretă dacă valorile sale individuale (variantele) diferă unele de altele printr-o anumită valoare finită (de obicei un număr întreg). Seria de variații a unei astfel de caracteristici se numește serie de variații discrete.

Tabelul 1. Vedere generală a unei serii de frecvență de variație discretă

Valori caracteristicex i x 1 x 2 x n
Frecvențelem i m 1 m 2 m n

O caracteristică se numește variabilă continuu dacă valorile sale diferă unele de altele printr-o cantitate arbitrar mică, de exemplu. un semn poate lua orice valoare într-un anumit interval. O serie de variații continue pentru o astfel de caracteristică se numește interval.

Tabelul 2. Vedere generală a seriei de variație a intervalului de frecvențe

Tabelul 3. Imagini grafice ale seriei de variații

RândPoligon sau histogramăFuncția de distribuție empirică
Discret
Interval
Prin revizuirea rezultatelor observațiilor, se determină câte valori variante se încadrează în fiecare interval specific. Se presupune că fiecare interval aparține unuia dintre capetele sale: fie în toate cazurile stânga (mai des), fie în toate cazurile dreapta, iar frecvențele sau frecvențele arată numărul de opțiuni conținute în limitele specificate. Diferențele a i – a i +1 se numesc intervale parțiale. Pentru a simplifica calculele ulterioare, seria de variații de interval poate fi înlocuită cu una condițional discretă. În acest caz, valoarea medie i-intervalul este luat ca optiune x i, și frecvența intervalului corespunzătoare m i– pentru frecvența acestui interval.
Pentru reprezentarea grafică a seriilor de variații, cele mai frecvent utilizate sunt poligonul, histograma, curba cumulativă și funcția de distribuție empirică.

În tabel 2.3 (Gruparea populației ruse după venitul mediu pe cap de locuitor în aprilie 1994) este prezentată serie de variații de interval.
Este convenabil să analizați seria de distribuție folosind o imagine grafică, ceea ce vă permite să judecați forma distribuției. O reprezentare vizuală a naturii modificărilor în frecvențele seriei de variații este dată de poligon și histogramă.
Poligonul este utilizat atunci când descrie serii de variații discrete.
Să reprezentăm, de exemplu, grafic distribuția fondului de locuințe pe tip de apartament (Tabelul 2.10).
Tabel 2.10 - Distribuția fondului de locuințe din mediul urban pe tip de apartament (cifre condiționate).


Orez. Zona de distribuție a locuințelor


Pe axele ordonatelor pot fi reprezentate nu numai valorile frecvenței, ci și frecvențele seriei de variații.
Histograma este utilizată pentru a descrie o serie de variații de interval. La construirea unei histograme, valorile intervalelor sunt reprezentate pe axa absciselor, iar frecvențele sunt reprezentate prin dreptunghiuri construite pe intervalele corespunzătoare. Înălțimea coloanelor în cazul intervalelor egale ar trebui să fie proporțională cu frecvențele. O histogramă este un grafic în care o serie este reprezentată ca bare adiacente una cu cealaltă.
Să descriem grafic seria de distribuție a intervalelor prezentată în tabel. 2.11.
Tabelul 2.11 - Distribuția familiilor în funcție de dimensiunea spațiului de locuit per persoană (cifre condiționate).
N p/p Grupuri de familii în funcție de dimensiunea spațiului de locuit per persoană Numărul de familii cu o anumită dimensiune a spațiului de locuit Numărul cumulat de familii
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Orez. 2.2. Histograma distribuției familiilor după mărimea spațiului de locuit per persoană


Folosind datele seriei acumulate (Tabelul 2.11), construim distribuție cumulată.


Orez. 2.3. Distribuția cumulativă a familiilor în funcție de dimensiunea spațiului de locuit per persoană


Reprezentarea unei serii de variații sub formă de cumulat este eficientă în special pentru serii de variații ale căror frecvențe sunt exprimate ca fracții sau procente din suma frecvențelor seriei.
Dacă schimbăm axele atunci când reprezentăm grafic o serie de variații sub formă de cumul, atunci obținem ogiva. În fig. 2.4 prezintă o ogivă construită pe baza datelor din tabel. 2.11.
O histogramă poate fi convertită într-un poligon de distribuție prin găsirea punctelor medii ale laturilor dreptunghiurilor și apoi conectând aceste puncte cu linii drepte. Poligonul de distribuție rezultat este prezentat în Fig. 2.2 cu o linie punctată.
Când se construiește o histogramă a distribuției unei serii de variații cu intervale inegale, nu frecvențele sunt reprezentate de-a lungul axei ordonatelor, ci densitatea distribuției caracteristicii în intervalele corespunzătoare.
Densitatea de distribuție este frecvența calculată pe unitatea de lățime a intervalului, adică câte unități sunt în fiecare grupă pe unitatea de valoare a intervalului. Un exemplu de calcul al densității de distribuție este prezentat în tabel. 2.12.
Tabel 2.12 - Distribuția întreprinderilor după numărul de angajați (cifre condiționate)
N p/p Grupuri de întreprinderi după numărul de angajați, oameni. Numărul de întreprinderi Dimensiunea intervalului, oameni. Densitatea de distribuție
A 1 2 3=1/2
1 Până la 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Poate fi folosit și pentru a reprezenta grafic serii de variații curba cumulativă. Folosind un cumulat (curbă sumă), este descrisă o serie de frecvențe acumulate. Frecvențele cumulate sunt determinate prin însumarea secvențială a frecvențelor între grupuri și arată câte unități din populație au valori ale atributelor nu mai mari decât valoarea luată în considerare.


Orez. 2.4. Ogiva repartizării familiilor după mărimea spațiului de locuit per persoană

Atunci când se construiesc cumulate ale unei serii de variații de interval, variantele seriei sunt reprezentate grafic de-a lungul axei absciselor, iar frecvențele acumulate sunt reprezentate de-a lungul axei ordonatelor.