- Mărimea eșantionului
- Cazul 1: dimensiunea populației nu este cunoscută
- Nivelurile de încredere și valorile lor Z corespunzătoare
- Cazul 2: dimensiunea populației este cunoscută
- Exemple
- Sondaje și chestionare
- QA
- Avantaj
- Dezavantaje
- Exercițiu rezolvat
- Soluţie
- Referințe
Eșantionarea aleatorie este modul de a selecta un eșantion reprezentativ statistic dintr - o anumită populație. O parte a principiului potrivit căreia fiecare element din eșantion trebuie să aibă aceeași probabilitate de a fi selectat.
O remiză este un exemplu de eșantionare aleatorie, în care fiecărui membru al populației participante i se atribuie un număr. Pentru a alege numerele corespunzătoare premiilor tombolei (eșantionul) se folosește o tehnică aleatorie, de exemplu extragerea dintr-o cutie poștală a numerelor notate pe cărți identice.
Figura 1. În eșantionarea la întâmplare, eșantionul este extras din populație la întâmplare, folosind o tehnică care să asigure că toate elementele au aceeași probabilitate de a fi alese. Sursa: netquest.com.
În eșantionarea aleatorie, este esențial să alegeți în mod corespunzător dimensiunea eșantionului, deoarece un eșantion nereprezentativ al populației poate duce la concluzii eronate, din cauza fluctuațiilor statistice.
Mărimea eșantionului
Există formule pentru determinarea dimensiunii corespunzătoare a unui eșantion. Cel mai important factor de luat în considerare este dacă dimensiunea populației este sau nu cunoscută. Să ne uităm la formulele pentru a determina dimensiunea eșantionului:
Cazul 1: dimensiunea populației nu este cunoscută
Când dimensiunea populației N este necunoscută, este posibil să selectați un eșantion de mărime adecvată n pentru a determina dacă o anumită ipoteză este adevărată sau falsă.
Pentru aceasta, se folosește următoarea formulă:
Unde:
-p este probabilitatea ca ipoteza să fie adevărată.
-q este probabilitatea ca acesta să nu fie, prin urmare q = 1 - p.
-E este marja relativă de eroare, de exemplu o eroare de 5% are o marjă de E = 0,05.
-Z are legătură cu nivelul de încredere cerut de studiu.
Într-o distribuție normalizată (sau normalizată), un nivel de încredere de 90% are Z = 1.645, deoarece probabilitatea ca rezultatul să fie cuprins între -1.645σ și + 1.645σ este 90%, unde σ este abaterea standard .
Nivelurile de încredere și valorile lor Z corespunzătoare
1.- 50% nivelul de încredere corespunde Z = 0,675.
2.- Nivelul de încredere de 68,3% corespunde Z = 1.
3.- Nivelul de încredere de 90% este echivalent cu Z = 1.645.
4.- 95% nivelul de încredere corespunde Z = 1,96
5.- 95,5% nivelul de încredere corespunde Z = 2.
6.- Nivelul de încredere de 99,7% este echivalent cu Z = 3.
Un exemplu în care această formulă poate fi aplicată ar fi într-un studiu pentru a determina greutatea medie a pietricelelor de pe o plajă.
În mod clar nu este posibil să studiați și să cântăriți toate pietricelele de pe plajă, de aceea este recomandabil să extrageți o probă cât mai aleatorie și cu un număr adecvat de elemente.
Figura 2. Pentru a studia caracteristicile pietricelelor de pe o plajă, este necesar să alegeți un eșantion aleatoriu cu un număr reprezentativ al acestora. (Sursa: pixabay)
Cazul 2: dimensiunea populației este cunoscută
Când este cunoscut numărul N de elemente care alcătuiesc o anumită populație (sau univers), dacă dorim să selectăm prin eșantionare aleatorie simplă un eșantion semnificativ statistic de mărime n, aceasta este formula:
Unde:
-Z este coeficientul asociat nivelului de încredere.
-p este probabilitatea succesului ipotezei.
-q este probabilitatea eșecului în ipoteză, p + q = 1.
-N este dimensiunea populației totale.
-E este eroarea relativă a rezultatului studiului.
Exemple
Metodologia de extragere a probelor depinde foarte mult de tipul de studiu care trebuie făcut. Prin urmare, eșantionarea aleatorie are un număr infinit de aplicații:
Sondaje și chestionare
De exemplu, în sondajele telefonice, persoanele care urmează să fie consultate sunt alese cu ajutorul unui generator de numere aleatoare, aplicabil regiunii studiate.
Dacă doriți să aplicați un chestionar angajaților unei companii mari, atunci puteți recurge la selecția respondenților prin numărul angajatului sau numărul cărții de identitate.
Numărul menționat trebuie, de asemenea, să fie ales la întâmplare, folosind de exemplu un generator de numere aleatoare.
Figura 3. Un chestionar poate fi aplicat selectând aleatoriu participanții. Sursa: Pixabay.
QA
În cazul în care studiul se bazează pe piese fabricate de o mașină, piesele trebuie alese aleatoriu, dar din loturi fabricate la diferite ore ale zilei sau în zile sau săptămâni diferite.
Avantaj
Eșantionare aleatorie simplă:
- Permite reducerea costurilor unui studiu statistic, deoarece nu este necesar să se studieze populația totală pentru a obține rezultate fiabile din punct de vedere statistic, cu nivelurile de încredere dorite și nivelul de eroare necesar în studiu.
- Evitați părtinirea: întrucât alegerea elementelor de studiat este complet aleatorie, studiul reflectă fidel caracteristicile populației, deși doar o parte din ea a fost studiată.
Dezavantaje
- Metoda nu este adecvată în cazurile în care doriți să cunoașteți preferințele din diferite grupuri sau straturi de populație.
În acest caz, este de preferat să se stabilească anterior grupurile sau segmentele pe care urmează să fie realizat studiul. Odată ce straturile sau grupurile au fost definite, atunci dacă este convenabil pentru fiecare dintre ele să aplice eșantionarea aleatorie.
- Este foarte puțin probabil să se obțină informații asupra sectoarelor minoritare, din care uneori este necesar să se cunoască caracteristicile acestora.
De exemplu, dacă este vorba despre realizarea unei campanii despre un produs scump, este necesar să cunoaștem preferințele sectoarelor celor mai bogate minorități.
Exercițiu rezolvat
Vrem să studiem preferințele populației față de o anumită băutură de cola, dar nu există un studiu anterior la această populație, despre care nu se cunoaște dimensiunea acesteia.
Pe de altă parte, eșantionul trebuie să fie reprezentativ cu un nivel de încredere minim de 90%, iar concluziile trebuie să aibă o eroare procentuală de 2%.
-Cum să determinați dimensiunea n a eșantionului?
-Care ar fi dimensiunea eșantionului dacă marja de eroare este mai flexibilă la 5%?
Soluţie
Deoarece dimensiunea populației nu este cunoscută, formula de mai sus este utilizată pentru a determina mărimea eșantionului:
n = (Z 2 p q) / (E 2 )
Presupunem că există o probabilitate egală de preferință (p) pentru brandul nostru de băuturi răcoritoare fără nicio preferință (q), deci p = q = 0,5.
Pe de altă parte, deoarece rezultatul studiului trebuie să aibă o eroare procentuală mai mică de 2%, eroarea relativă E va fi de 0,02.
În cele din urmă, o valoare Z = 1.645 produce un nivel de încredere de 90%.
Rezumând, avem următoarele valori:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Cu aceste date, se calculează dimensiunea minimă a eșantionului:
n = (1.645 2 0.5 0.5) / (0.02 2 ) = 1691,3
Aceasta înseamnă că studiul cu marja de eroare necesară și cu nivelul de încredere ales, trebuie să aibă un eșantion de respondenți de cel puțin 1692 de persoane, alese prin eșantionare aleatorie simplă.
Dacă treceți de la o marjă de eroare de la 2% la 5%, atunci noua dimensiune a eșantionului este:
n = (1.645 2 0.5 0.5) / (0.05 2 ) = 271
Ceea ce reprezintă un număr semnificativ mai mic de indivizi. În concluzie, dimensiunea eșantionului este foarte sensibilă la marja dorită de eroare din studiu.
Referințe
- Berenson, M. 1985. Statistici pentru management și economie, concepte și aplicații. Editorial Interamericana.
- Statistici. Eșantionarea aleatorie. Luat de la: enccyclopediaeconomica.com.
- Statistici. Prelevarea de probe. Recuperat de la: Estadistica.mat.uson.mx.
- Explorable. Eșantionarea aleatorie. Recuperat din: explorable.com.
- Moore, D. 2005. Statistici de bază aplicate. 2a. Ediție.
- Netquest. Eșantionarea aleatorie. Recuperat de la: netquest.com.
- Wikipedia. Eșantionarea statistică. Recuperat de la: en.wikipedia.org