- Formulă
- Caracteristicile distribuției normale
- Intervale de încredere
- Aplicații ale distribuției normale
- Exemplu
- Exercițiu rezolvat
- Referințe
Distribuția normală sau distribuția Gaussiană este distribuția probabilității într-o variabilă continuă, în care funcția densității probabilității este descrisă de o funcție exponențială a argumentului cvadratic și negativ, care dă naștere unei forme de clopot.
Numele de distribuție normală provine de la faptul că această distribuție este cea care se aplică la cel mai mare număr de situații în care o anumită variabilă aleatorie continuă este implicată într-un grup sau o populație dată.
Figura 1. Distribuția normală N (x; μ, σ) și densitatea probabilității sale f (s; μ, σ). (Elaborare proprie)
Exemple în care se aplică distribuția normală sunt: înălțimea bărbaților sau a femeilor, variații ale măsurii de o anumită mărime fizică sau în trăsături psihologice sau sociologice măsurabile, cum ar fi coeficientul intelectual sau obiceiurile de consum ale unui anumit produs.
Pe de altă parte, se numește distribuție gaussiană sau clopot gaussian, deoarece este acest geniu matematic german care este creditat cu descoperirea sa pentru utilizarea pe care i-a dat-o pentru a descrie eroarea statistică a măsurărilor astronomice din anul 1800.
Cu toate acestea, se afirmă că această distribuție statistică a fost publicată anterior de un alt mare matematician de origine franceză, cum ar fi Abraham de Moivre, din 1733.
Formulă
Funcția normală de distribuție în variabila continuă x, cu parametrii μ și σ, este notată prin:
N (x; μ, σ)
și este scris explicit astfel:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
unde f (u; μ, σ) este funcția densității de probabilitate:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
Constanta care înmulțește funcția exponențială în funcția de densitate a probabilității se numește constantă de normalizare și a fost aleasă astfel încât:
N (+ ∞, μ, σ) = 1
Expresia anterioară asigură că probabilitatea ca variabila aleatoare x să fie între -∞ și + ∞ este 1, adică 100% probabilitate.
Parametrul μ este media aritmetică a variabilei aleatorii continue x și σ deviația standard sau rădăcina pătrată a variației aceleiași variabile. În cazul în care μ = 0 și σ = 1, atunci avem distribuția normală normală sau distribuția normală tipică:
N (x; μ = 0, σ = 1)
Caracteristicile distribuției normale
1- Dacă o variabilă statistică aleatorie urmărește o distribuție normală a densității probabilității f (s; μ, σ), majoritatea datelor sunt grupate în jurul valorii medii μ și sunt împrăștiate în jurul acesteia în așa fel încât puțin mai mult decât ⅔ a datelor este cuprinsă între μ - σ și μ + σ.
2- Abaterea standard σ este întotdeauna pozitivă.
3- Forma funcției de densitate f este similară cu cea a unui clopot, motiv pentru care această funcție este adesea numită clopot gaussian sau funcție gaussiană.
4- Într-o distribuție gaussiană media, mediul și modul coincid.
5- Punctele de inflexiune ale funcției densității probabilității sunt exact la μ - σ și μ + σ.
6- Funcția f este simetrică față de o axă care trece prin valoarea sa medie μ și are asimptotic zero pentru x ⟶ + ∞ și x ⟶ -∞.
7- Cu cât valoarea σ este mai mare, cu atât este mai mare dispersia, zgomotul sau distanța datelor în jurul valorii medii. Cu alte cuvinte, forma de clopot σ mai mare este mai deschisă. Pe de altă parte, σ mic indică faptul că zarurile sunt apropiate de medie și forma clopotului este mai închisă sau orientată.
8- Funcția de distribuție N (x; μ, σ) indică probabilitatea ca variabila aleatoare să fie mai mică sau egală cu x. De exemplu, în figura 1 (de mai sus) probabilitatea P ca variabila x să fie mai mică sau egală cu 1,5 este de 84% și corespunde zonei sub funcția de densitate de probabilitate f (x; μ, σ) din -∞ la x.
Intervale de încredere
9- Dacă datele urmează o distribuție normală, atunci 68,26% dintre acestea sunt cuprinse între μ - σ și μ + σ.
10- 95,44% din datele care urmează o distribuție normală sunt cuprinse între μ - 2σ și μ + 2σ.
11- 99,74% din datele care urmează o distribuție normală sunt cuprinse între μ - 3σ și μ + 3σ.
12- Dacă o variabilă aleatoare x urmează o distribuție N (x; μ, σ), atunci variabila
z = (x - μ) / σ urmează distribuția normală normală N (z; 0,1).
Schimbarea variabilei x la z se numește standardizare sau dactilografiere și este foarte utilă atunci când se aplică tabelele distribuției standard la datele care urmează o distribuție normală non-standard.
Aplicații ale distribuției normale
Pentru a aplica distribuția normală este necesar să parcurgem calculul integralei densității de probabilitate, care din punct de vedere analitic nu este ușor și nu există întotdeauna un program de calculator care să permită calcularea sa numerică. În acest scop, sunt utilizate tabele cu valori normalizate sau standardizate, care nu este altceva decât distribuția normală în cazul μ = 0 și σ = 1.
Tabel normalizat de distribuție (partea 1/2)
Tabel normalizat de distribuție (partea 2/2)
Trebuie menționat că aceste tabele nu includ valori negative. Cu toate acestea, folosind proprietățile de simetrie ale funcției de densitate a probabilității gaussiene, se pot obține valorile corespunzătoare. Exercițiul rezolvat prezentat mai jos indică utilizarea tabelului în aceste cazuri.
Exemplu
Să presupunem că aveți un set de date aleatorii x care urmează o distribuție normală a mediei 10 și abaterea standard 2. Vi se cere să aflați probabilitatea ca:
a) Variabila aleatoare x este mai mică sau egală cu 8.
b) este mai mic sau egal cu 10.
c) Că variabila x este sub 12.
d) Probabilitatea ca o valoare x să fie între 8 și 12.
Soluţie:
a) Pentru a răspunde la prima întrebare, trebuie doar să calculați:
N (x; μ, σ)
Cu x = 8, μ = 10 și σ = 2. Ne dăm seama că este o integrală care nu are o soluție analitică în funcțiile elementare, dar soluția este exprimată ca funcție a funcției de eroare erf (x).
Pe de altă parte, există posibilitatea rezolvării integralei sub formă numerică, ceea ce fac multe calculatoare, foi de calcul și programe de calculator, cum ar fi GeoGebra. Figura următoare arată soluția numerică corespunzătoare primului caz:
Figura 2. Densitatea probabilității f (x; μ, σ). Zona umbrită reprezintă P (x ≤ 8). (Elaborare proprie)
iar răspunsul este că probabilitatea ca x să fie sub 8 este:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) În acest caz, scopul este de a găsi probabilitatea ca variabila aleatoare x să fie sub medie, care în acest caz valorează 10. Răspunsul nu necesită niciun calcul, deoarece știm că jumătate din date sunt sub medie și cealaltă jumătate peste medie. Prin urmare, răspunsul este:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Pentru a răspunde la această întrebare, trebuie să calculăm N (x = 12; μ = 10, σ = 2), care se poate face cu un calculator care are funcții statistice sau prin software precum GeoGebra:
Figura 3. Densitatea probabilității f (x; μ, σ). Zona umbrită reprezintă P (x ≤ 12). (Elaborare proprie)
Răspunsul la partea c poate fi văzut în figura 3 și este:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
d) Pentru a afla probabilitatea ca variabila aleatoare x să fie cuprinsă între 8 și 12, putem folosi rezultatele pieselor a și c astfel:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Exercițiu rezolvat
Prețul mediu al acțiunilor unei companii este de 25 USD cu o abatere standard de 4 dolari. Determinați probabilitatea ca:
a) O acțiune are un cost mai mic de 20 USD.
b) Aceasta are un cost mai mare de 30 $.
c) Prețul este cuprins între 20 și 30 USD.
Utilizați tabelele de distribuție normale pentru a găsi răspunsurile.
Soluţie:
Pentru a folosi tabelele, este necesar să treceți la variabila z normalizată sau tastată:
20 USD în variabila normalizată este egală cu z = (20 $ - 25 $) / 4 $ = -5/4 = -1,25 și
30 USD în variabila normalizată este egală cu z = (30 $ - 25 $) / 4 $ = +5/4 = +1,25.
a) 20 dolari este egal cu -1,25 în variabila normalizată, dar tabelul nu are valori negative, așadar plasăm valoarea +1,25 care dă valoarea de 0,8944.
Dacă 0,5 este scăzut din această valoare, rezultatul va fi zona cuprinsă între 0 și 1,25 care, apropo, este identică (prin simetrie) cu zona cuprinsă între -1,25 și 0. Rezultatul scăderii este 0,8944 - 0,5 = 0,3944 care este aria cuprinsă între -1,25 și 0.
Dar zona de la -∞ la -1,25 este de interes, care va fi 0,5 - 0,3944 = 0,1056. Prin urmare, se concluzionează că probabilitatea ca un stoc să fie sub $ 20 este de 10,56%.
b) 30 USD în variabila tastată z este 1,25. Pentru această valoare, tabelul arată numărul 0.8944, care corespunde zonei de la -∞ la +1.25. Zona cuprinsă între +1.25 și + ∞ este (1 - 0.8944) = 0.1056. Cu alte cuvinte, probabilitatea ca o acțiune să coste mai mult de 30 de dolari este de 10,56%.
c) Probabilitatea ca o acțiune să aibă un cost cuprins între 20 și 30 USD se calculează după cum urmează:
100% -10,56% - 10,56% = 78,88%
Referințe
- Statistică și probabilitate. Distributie normala. Recuperat de la: projectdescartes.org
- GeoGebra. Geogebra clasică, calculul probabilității. Recuperat de la geogebra.org
- MathWorks. Distribuția Gaussiană. Recuperat de la: es.mathworks.com
- Mendenhall, W. 1981. Statistici pentru management și economie. 3a. ediție. Grupo Editorial Iberoamérica.
- Stat Trek. Învață-te statisticile. Distribuție Poisson. Recuperat de la: stattrek.com,
- Triola, M. 2012. Statistici elementare. 11. Ed. Pearson Education.
- Universitatea din Vigo. Principalele distribuții continue. Recuperat din: anapg.webs.uvigo.es
- Wikipedia. Distributie normala. Recuperat de la: es.wikipedia.org