- Formula și ecuațiile
- Diferențe cu distribuția binomială
- Exemple
- Aplicații practice
- Apropierea distribuției binomiale cu distribuția Poisson
- Exerciții rezolvate
- Exercitiul 1
- Soluție c)
- Exercițiul 2
- Solutie la)
- Referințe
Distribuția Poisson este o distribuție de probabilitate discretă, prin care este posibil să știm probabilitatea ca, într-o dimensiune mare a eșantionului și în timpul unui anumit interval, să apară un eveniment a cărui probabilitate este mică.
De multe ori, distribuția Poisson poate fi utilizată în locul distribuției binomiale, atât timp cât sunt îndeplinite următoarele condiții: probă mare și probabilitate mică.
Figura 1. Graficul distribuției Poisson pentru diferiți parametri. Sursa: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) a creat această distribuție care îi poartă numele, foarte util atunci când vine vorba de evenimente imprevizibile. Poisson și-a publicat rezultatele în 1837, o lucrare de anchetă privind probabilitatea apariției de sentințe penale eronate.
Ulterior, alți cercetători au adaptat distribuția în alte zone, de exemplu, numărul de stele care pot fi găsite într-un anumit volum de spațiu sau probabilitatea ca un soldat să moară din lovitura unui cal.
Formula și ecuațiile
Forma matematică a distribuției Poisson este următoarea:
- μ (de asemenea, uneori notat ca λ) este media sau parametrul distribuției
- Număr Euler: e = 2.71828
- Probabilitatea obținerii y = k este P
- k este numărul de succese 0, 1,2,3 …
- n este numărul de teste sau evenimente (dimensiunea eșantionului)
Variabilele aleatorii discrete, după cum le numește numele lor, depind de șansă și iau doar valori discrete: 0, 1, 2, 3, 4 …, k.
Media distribuției este dată de:
Varianța σ, care măsoară răspândirea datelor, este un alt parametru important. Pentru distribuția Poisson este:
σ = μ
Poisson a stabilit că atunci când n → ∞, și p → 0, media μ - numită și valoarea așteptată - tinde către o constantă:
-Evenimentele sau evenimentele considerate sunt independente între ele și se produc la întâmplare.
-Probabilitatea P a unui anumit eveniment care are loc într-o anumită perioadă de timp este foarte mică: P → 0.
-Probabilitatea apariției mai multor evenimente în intervalul de timp este 0.
-Valoarea medie se apropie de o constantă dată de: μ = np (n este mărimea eșantionului)
-Deoarece dispersia σ este egală cu μ, deoarece adoptă valori mai mari, variabilitatea devine de asemenea mai mare.
-Evenimentele trebuie distribuite uniform în intervalul de timp utilizat.
-Setul valorilor posibile ale evenimentului y este: 0,1,2,3,4….
-Suma variabilelor i care urmează o distribuție Poisson este, de asemenea, o altă variabilă Poisson. Valoarea medie este suma valorilor medii ale acestor variabile.
Diferențe cu distribuția binomială
Distribuția Poisson diferă de distribuția binomială în următoarele moduri importante:
-Distribuția binomială este afectată atât de dimensiunea eșantionului n, cât și de probabilitatea P, dar distribuția Poisson este afectată doar de media μ.
-Într-o distribuție binomială, valorile posibile ale variabilei aleatoare y sunt 0,1,2,…, N, în timp ce în distribuția Poisson nu există o limită superioară pentru aceste valori.
Exemple
Poisson a aplicat inițial celebra sa distribuție în cazurile legale, dar la nivel industrial, una dintre primele sale utilizări a fost cea a berii. În acest proces, culturile de drojdie sunt utilizate pentru fermentare.
Drojdia constă din celule vii, a căror populație este variabilă în timp. La fabricarea berii este necesar să se adauge cantitatea necesară, de aceea este necesar să se cunoască cantitatea de celule care există pe unitatea de volum.
În timpul celui de-al Doilea Război Mondial, distribuția Poisson a fost folosită pentru a afla dacă germanii ținteau de fapt spre Londra din Calais, sau doar trăgeau la întâmplare. Acest lucru a fost important pentru aliați pentru a determina cât de bună era tehnologia de care dispuneau naziștii.
Aplicații practice
Aplicațiile distribuției Poisson se referă întotdeauna la numărări în timp sau la numărare în spațiu. Și întrucât probabilitatea de apariție este mică, este cunoscută și sub denumirea de „legea evenimentelor rare”.
Iată o listă de evenimente care se încadrează într-una din aceste categorii:
-Registrarea particulelor într-o descompunere radioactivă, care, la fel ca și creșterea celulelor de drojdie, este o funcție exponențială.
-Număr de vizite la un anumit site web.
-Arrivarea persoanelor către o linie care să plătească sau să fie participată (teoria cozii).
-Număr de mașini care trec un anumit punct pe un drum, într-un interval de timp dat.
Figura 2. Numărul de mașini care trec printr-un punct urmărește aproximativ o distribuție Poisson. Sursa: Pixabay.
-Mutatiile suferite intr-un anumit lant ADN dupa ce au fost expuse la radiatii.
-Numărul de meteoriți cu un diametru mai mare de 1 m a căzut într-un an.
-Defecte pe metru pătrat dintr-o țesătură.
-Cantitatea celulelor sanguine în 1 centimetru cub.
-Capele pe minut la o centrală telefonică.
-Frituri de ciocolată prezente în 1 kg de coacere tort.
-Număr de copaci infectați de un anumit parazit în 1 hectar de pădure.
Rețineți că aceste variabile aleatorii reprezintă numărul de ori pe care un eveniment are loc într-o perioadă determinată de timp (apeluri pe minut la telefonul telefonic) sau o anumită regiune de spațiu (defecte de țesătură pe metru pătrat).
Aceste evenimente, așa cum sa stabilit deja, sunt independente de timpul care a trecut de la ultima apariție.
Apropierea distribuției binomiale cu distribuția Poisson
Distribuția Poisson este o bună aproximație la distribuția binomială atât timp cât:
-Mărimea eșantionului este mare: n ≥ 100
-Probabilitatea p este mică: p ≤ 0.1
- μ este de ordinul: np ≤ 10
În astfel de cazuri, distribuția Poisson este un instrument excelent, deoarece distribuția binomială poate fi dificil de aplicat în aceste cazuri.
Exerciții rezolvate
Exercitiul 1
Un studiu seismologic a stabilit că în ultimii 100 de ani, au existat 93 de cutremure mari în întreaga lume, cu cel puțin 6,0 pe scara Richter -logaritmic-. Să presupunem că distribuția Poisson este un model adecvat în acest caz. Găsi:
a) Apariția medie a cutremurelor mari pe an.
b) Dacă P (y) este probabilitatea să se producă cutremure în timpul unui an selectat aleatoriu, găsiți următoarele probabilități:
Este cu mult mai mic decât P (2).
Rezultatele sunt enumerate mai jos:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0.0000471.
De exemplu, am putea spune că există o probabilitate de 39,5% ca niciun cutremur major să nu aibă loc într-un an dat. Sau că există 5,29% din 3 cutremure mari care au avut loc în acel an.
Soluție c)
c) Frecvențele sunt analizate, înmulțindu-se cu n = 100 de ani:
39.5; 36,7; 17,1; 5,29; 1.23; 0.229; 0,0355 și 0,00471.
De exemplu:
- O frecvență de 39,5 indică faptul că 0 cutremure mari au avut loc în 39,5 din 100 de ani, am putea spune că este destul de aproape de rezultatul efectiv de 47 de ani fără un cutremur mare.
Să comparăm un alt rezultat Poisson cu rezultatele reale:
- Valoarea obținută de 36,7 înseamnă că, într-o perioadă de 37 de ani, există un mare cutremur. Rezultatul real este că în 31 de ani a avut loc 1 cutremur major, o potrivire bună cu modelul.
- 17,1 ani sunt așteptați cu 2 cutremure mari și se știe că în 13 ani, ceea ce este o valoare apropiată, au existat într-adevăr 2 cutremure mari.
Prin urmare, modelul Poisson este acceptabil pentru acest caz.
Exercițiul 2
O companie estimează că numărul de componente care nu reușesc înainte de a atinge 100 de ore de funcționare urmează o distribuție Poisson. Dacă numărul mediu de eșecuri este de 8 în acel timp, găsiți următoarele probabilități:
a) Că o componentă eșuează în 25 de ore.
b) Eșecul a mai puțin de două componente, în 50 de ore.
c) Cel puțin trei componente nu reușesc în 125 de ore.
Solutie la)
a) Se știe că media eșecurilor în 100 de ore este 8, prin urmare în 25 de ore este de așteptat un sfert din eșecuri, adică 2 eșecuri. Acesta va fi parametrul μ.
Probabilitatea ca 1 componentă să eșueze este solicitată, variabila aleatorie este „componente care nu reușesc înainte de 25 de ore”, iar valoarea sa este y = 1. Prin substituirea funcției de probabilitate:
Cu toate acestea, întrebarea este probabilitatea ca mai puțin de două componente să nu funcționeze în 50 de ore, nu că două componente să nu funcționeze în 50 de ore, de aceea trebuie să adăugăm probabilitățile că:
-Nu eșuează
- Eșec numai 1
Parametrul μ al distribuției în acest caz este:
μ = 8 + 2 = 10 eșecuri în 125 de ore.
P (3 sau mai multe componente eșuează) = 1- P (0) - P (1) - P (2) =
Referințe
- MathWorks. Distribuție Poisson. Recuperat de la: es.mathworks.com
- Mendenhall, W. 1981. Statistici pentru management și economie. 3a. ediție. Grupo Editorial Iberoamérica.
- Stat Trek. Învață-te statisticile. Distribuție Poisson. Recuperat de la: stattrek.com,
- Triola, M. 2012. Statistici elementare. 11. Ed. Pearson Education.
- Wikipedia. Distribuție Poisson. Recuperat de la: en.wikipedia.org