- Formule și ecuații
- Variabile statistice importante
- Model și proprietăți
- Principalele proprietăți ale distribuției hipergeometrice
- Aproximare folosind distribuția binomială
- Exemplul 2
- Exerciții rezolvate
- Exercitiul 1
- Soluţie
- Exercițiul 2
- Soluţie
- Exercițiul 3
- Solutie la
- Soluție c
- Referințe
Distribuția hipergeometrică este o funcție statistică discretă, potrivită pentru calcularea probabilității în experimente randomizate cu două rezultate posibile. Condiția care trebuie să o aplice este aceea că sunt populații mici, în care retragerile nu sunt înlocuite și probabilitățile nu sunt constante.
Prin urmare, atunci când un element al populației este ales pentru a cunoaște rezultatul (adevărat sau fals) al unei anumite caracteristici, același element nu poate fi ales din nou.
Figura 1. Într-o populație cu șuruburi ca aceasta, cu siguranță există exemplare defecte. Sursa: Pixabay.
Cu siguranță, următorul element ales este astfel mai probabil să obțină un rezultat adevărat, dacă elementul anterior a avut un rezultat negativ. Aceasta înseamnă că probabilitatea variază pe măsură ce elementele sunt extrase din eșantion.
Principalele aplicații ale distribuției hipergeometrice sunt: controlul calității în procesele cu populație redusă și calculul probabilităților în jocurile de noroc.
În ceea ce privește funcția matematică care definește distribuția hipergeometrică, aceasta constă din trei parametri, care sunt:
- Numărul de elemente ale populației (N)
- Mărimea eșantionului (m)
- numărul de evenimente din întreaga populație cu un rezultat favorabil (sau nefavorabil) al caracteristicii studiate (n).
Formule și ecuații
Formula pentru distribuția hipergeometrică dă probabilitatea P ca să apară x cazuri favorabile unei anumite caracteristici. Modul de a scrie matematic, pe baza numerelor combinatorii este:
În expresia anterioară N, n și m sunt parametri și x este variabila în sine.
- Populația totală este de N.
-Numărul de rezultate pozitive ale unei anumite caracteristici binare în raport cu populația totală este n.
-Cantitatea elementelor din eșantion este de m.
În acest caz, X este o variabilă aleatorie care ia valoarea x și P (x) indică probabilitatea apariției x cazuri favorabile ale caracteristicii studiate.
Variabile statistice importante
Alte variabile statistice pentru distribuția hipergeometrică sunt:
- Media μ = m * n / N
- Variația σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Abaterea standard σ care este rădăcina pătrată a variației.
Model și proprietăți
Pentru a ajunge la modelul distribuției hipergeometrice, pornim de la probabilitatea obținerii x cazuri favorabile într-un eșantion de mărime m. Acest eșantion conține elemente care respectă proprietatea studiată și elemente care nu.
Reamintim că n reprezintă numărul de cazuri favorabile în populația totală de N elemente. Atunci probabilitatea va fi calculată astfel:
Prin expresia de mai sus sub formă de numere combinatorii, se ajunge la următorul model de distribuție a probabilităților:
Principalele proprietăți ale distribuției hipergeometrice
Acestea sunt următoarele:
- Eșantionul trebuie să fie întotdeauna mic, chiar dacă populația este mare.
- Elementele eșantionului sunt extrase unul câte unul, fără a le încorpora înapoi în populație.
- Proprietatea de studiat este binară, adică poate lua doar două valori: 1 sau 0, sau adevărată sau falsă.
În fiecare etapă de extragere a elementelor, probabilitatea se schimbă în funcție de rezultatele anterioare.
Aproximare folosind distribuția binomială
O altă proprietate a distribuției hipergeometrice este aceea că poate fi aproximată de distribuția binomială, notată Bi, atât timp cât populația N este mare și de cel puțin 10 ori mai mare decât eșantionul m. În acest caz, ar arăta astfel:
Probabilitatea ca x = 3 șuruburi din eșantion să fie defecte este: P (500, 5, 60, 3) = 0.0129.
La rândul său, probabilitatea ca x = 4 șuruburi din cele șaizeci din eșantion să fie defecte: P (500, 5, 60; 4) = 0,0008.
În cele din urmă, probabilitatea ca x = 5 șuruburi în eșantion să fie defecte este: P (500, 5, 60; 5) = 0.
Dar dacă doriți să știți probabilitatea ca în eșantionul respectiv să existe mai mult de 3 șuruburi defecte, atunci trebuie să obțineți probabilitatea cumulativă, adăugând:
Acest exemplu este ilustrat în figura 2, obținut prin utilizarea GeoGebra, un software gratuit utilizat pe scară largă în școli, institute și universități.
Figura 2. Exemplu de distribuție hipergeometrică. Pregătit de F. Zapata cu GeoGebra.
Exemplul 2
O punte de punte spaniolă are 40 de cărți, din care 10 au aur, iar restul de 30 nu. Să presupunem că 7 cărți sunt trase la întâmplare din acel punte, care nu sunt reincorporate în punte.
Dacă X este numărul de aururi prezent în cele 7 cărți desenate, atunci probabilitatea de a avea x aururi într-o remiză de 7 cărți este dată de distribuția hipergeometrică P (40,10,7; x).
Să vedem așa: pentru a calcula probabilitatea de a avea 4 aururi într-o remiză de 7 cărți, folosim formula distribuției hipergeometrice cu următoarele valori:
Iar rezultatul este: 4.57% probabilitate.
Dar dacă doriți să știți probabilitatea de a obține mai mult de 4 cărți, trebuie să adăugați:
Exerciții rezolvate
Următorul set de exerciții este destinat să ilustreze și să asimileze conceptele prezentate în acest articol. Este important ca cititorul să încerce să le rezolve singur, înainte de a privi soluția.
Exercitiul 1
O fabrică de prezervative a descoperit că din 1000 de prezervative produse de o anumită mașină, 5 sunt defecte. Pentru controlul calității, 100 de prezervative sunt luate la întâmplare și lotul este respins dacă există cel puțin unul sau mai multe defecte. Răspuns:
a) Care este posibilitatea ca o mulțime de 100 să fie aruncate?
b) Este eficient acest criteriu de control al calității?
Soluţie
În acest caz, vor apărea numere combinatorii foarte mari. Calculul este dificil, cu excepția cazului în care aveți un pachet software adecvat.
Dar, deoarece este o populație mare și eșantionul este de zece ori mai mic decât populația totală, este posibilă utilizarea aproximării distribuției hiperometrice prin distribuția binomială:
În expresia de mai sus C (100, x) este un număr combinat. Atunci probabilitatea de a avea mai mult de un defect va fi calculată astfel:
Este o aproximare excelentă, în comparație cu valoarea obținută prin aplicarea distribuției hipergeometrice: 0,4102
Se poate spune că, cu o probabilitate de 40%, ar trebui aruncat un lot de 100 de profilactice, ceea ce nu este foarte eficient.
Dar, fiind puțin mai puțin pretențioși în procesul de control al calității și eliminând lotul de 100 doar dacă există două sau mai multe defecte, atunci probabilitatea de a arunca lotul ar scădea la doar 8%.
Exercițiul 2
O mașină de bloc din plastic funcționează astfel încât din fiecare 10 bucăți, una iese deformată. Într-un eșantion de 5 bucăți, cât de probabil este ca o singură bucată să fie defectă?
Soluţie
Populație: N = 10
Numărul n de defecte pentru fiecare N: n = 1
Dimensiunea eșantionului: m = 5
Prin urmare, există o probabilitate de 50% ca într-un eșantion de 5, un bloc să fie deformat.
Exercițiul 3
Într-o întâlnire a tinerilor absolvenți de liceu sunt 7 doamne și 6 domni. Dintre fete, 4 studiază științe umaniste și 3 științe. În grupul de băieți, 1 studiază științe umaniste și 5 științe. Calculați următoarele:
a) Alegerea a trei fete la întâmplare: cât de probabil este că toate studiază științe umaniste?
b) Dacă trei participanți la întâlnirea de prieteni sunt aleși la întâmplare: Care este posibilitatea ca trei dintre ei, indiferent de gen, să studieze știința pe toate trei sau științele umaniste, de asemenea, toate cele trei?
c) Acum alegeți doi prieteni la întâmplare și numiți x variabila aleatorie „numărul celor care studiază științele umaniste”. Între cele două alese, determinați valoarea medie sau așteptată a lui x și variația σ ^ 2.
Solutie la
Valorile de utilizat acum sunt:
-Populație: N = 14
-Calitatea care studiază literele este: n = 6 și
-Mărimea probei: m = 3.
-Număr de prieteni care studiază științe umaniste: x
Conform acestui fapt, x = 3 înseamnă că toate cele trei studiază științele umaniste, dar x = 0 înseamnă că niciunul nu studiază științele umaniste. Probabilitatea ca toate cele trei să studieze la fel este dată de sumă:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Atunci avem o probabilitate de 21% ca trei participanți la ședință, aleși la întâmplare, să studieze același lucru.
Soluție c
Aici avem următoarele valori:
N = 14 populație totală de prieteni, n = 6 număr total din populația care studiază științe umaniste, mărimea eșantionului este m = 2.
Speranța este:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
Și variația:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0.4521
Referințe
- Distribuții de probabilitate discrete. Recuperat din: biplot.usal.es
- Statistică și probabilitate. Distribuție hipergeometrică. Recuperat de la: projectdescartes.org
- CDPYE-UGR. Distribuție hipergeometrică. Recuperat din: ugr.es
- GeoGebra. Geogebra clasică, calculul probabilității. Recuperat de la geogebra.org
- Încercați ușor. S-au rezolvat probleme de distribuție hipergeometrică. Recuperat de la: probafacil.com
- Minitab. Distribuție hipergeometrică. Recuperat de la: support.minitab.com
- Universitatea din Vigo. Distribuții discrete principale. Recuperat din: anapg.webs.uvigo.es
- Vitutor. Statistici și combinații. Recuperat de la: vitutor.net
- Weisstein, Eric W. Distribuția hipergeometrică. Recuperat de la: mathworld.wolfram.com
- Wikipedia. Distribuție hipergeometrică. Recuperat din: es.wikipedia.com