- Formule și ecuații
- Cum se calculează eroarea de eșantionare
- Pentru un nivel de încredere
- Exemple
- - Exemplul 1
- Soluţie
- - Exemplul 2
- Soluţie
- - Exemplul 3
- Soluţie
- - Exemplul 4
- Soluţie
- - Exercițiul 5
- Soluţie
- Referințe
De eșantionare de eroare sau de eșantionare de eroare în statistică este diferența dintre valoarea medie a unei probe , iar valoarea medie a populației totale. Pentru a ilustra ideea, să ne imaginăm că populația totală a unui oraș este de un milion de oameni, din care doriți dimensiunea medie a pantofilor, pentru care este prelevat un eșantion aleatoriu de o mie de persoane.
Mărimea medie care rezultă din eșantion nu va coincide neapărat cu cea a populației totale, deși dacă eșantionul nu este părtinitor, valoarea trebuie să fie apropiată. Această diferență între valoarea medie a eșantionului și cea a populației totale este eroarea de eșantionare.
Figura 1. Deoarece eșantionul este un subset al populației totale, media eșantionului are o marjă de eroare. Sursa: F. Zapata.
Valoarea medie a populației totale este în general necunoscută, dar există tehnici de reducere a acestei erori și formule de estimare a marjei erorii de eșantionare care vor fi discutate în acest articol.
Formule și ecuații
Să spunem că dorim să cunoaștem valoarea medie a unei anumite caracteristici măsurabile x la o populație cu dimensiunea N, dar, întrucât N este un număr mare, nu este posibil să se efectueze studiul asupra populației totale, atunci se procedează la prelevarea unui eșantion aleatoriu de dimensiunea n <
Valoarea medie a eșantionului este notată cu
Să presupunem că m eșantioane sunt prelevate din populația totală N, toate de dimensiuni egale n cu valori medii
Aceste valori medii nu vor fi identice între ele și vor fi în jurul valorii medii a populației μ. Marja E de eșantionare E indică separarea preconizată a valorilor medii
Marja standard de eroare a eșantionului de dimensiunea n este:
ε = σ / √n
unde σ este abaterea standard (rădăcina pătrată a variației), care este calculată folosind următoarea formulă:
σ = √
Sensul marjei standard de eroare ε este următorul:
Valoarea medie
Cum se calculează eroarea de eșantionare
În secțiunea anterioară, a fost dată formula pentru a găsi marja de eroare standard a unui eșantion cu dimensiunea n, unde cuvântul standard indică faptul că este o marjă de eroare cu 68% încredere.
Acest lucru indică faptul că, dacă s-au luat multe eșantioane de aceeași mărime n, 68% dintre ele vor da valori medii
Există o regulă simplă, numită regula 68-95-99.7, care ne permite să găsim cu ușurință marja de eroare E pentru eșantionare pentru niveluri de încredere de 68%, 95% și 99,7%, deoarece această marjă este 1⋅ ε, 2 ⋅ ε și, respectiv, 3⋅ ε.
Pentru un nivel de încredere
Dacă nivelul de încredere γ nu este unul dintre cele de mai sus, atunci eroarea de eșantionare este abaterea standard σ înmulțită cu factorul Zγ, care este obținut prin procedura următoare:
1.- În primul rând, se determină nivelul de semnificație α, care se calculează de la nivelul de încredere γ prin următoarea relație: α = 1 - γ
2.- Atunci trebuie să calculăm valoarea 1 - α / 2 = (1 + γ) / 2, care corespunde frecvenței normale acumulate între -∞ și Zγ, într-o distribuție normală sau gaussiană tipificată F (z), a cărei definiție poate fi văzută în figura 2.
3.- Ecuația F (Zγ) = 1 - α / 2 este rezolvată cu ajutorul tabelelor distribuției normale (cumulate) F sau prin intermediul unei aplicații computerizate care are funcția Gaussiană inversă F -1 .
În ultimul caz, avem:
Zγ = G -1 (1 - α / 2).
4.- În sfârșit, această formulă este aplicată pentru eroarea de eșantionare cu un nivel de fiabilitate γ:
E = Zγ ⋅ (σ / √n)
Figura 2. Tabelul distribuției normale. Sursa: Wikimedia Commons.
Exemple
- Exemplul 1
Calculați marja de eroare standard în greutatea medie a unui eșantion de 100 de nou-născuți. Calculul ponderii medii a fost
Soluţie
Marja standard de eroare este ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. Aceasta înseamnă că, cu aceste date, se poate deduce că greutatea de 68% dintre nou-născuți este cuprinsă între 2.950 kg și 3.25 kg.
- Exemplul 2
Determinați marja de eșantionare a erorii E și intervalul de greutate de 100 de nou-născuți cu un nivel de încredere de 95% dacă greutatea medie este de 3.100 kg cu abatere standard σ = 1.500 kg.
Soluţie
Dacă se aplică regula 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, avem:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Cu alte cuvinte, 95% dintre nou-născuți vor avea greutăți cuprinse între 2.800 kg și 3.400 kg.
- Exemplul 3
Determinați gama ponderilor nou-născuților din Exemplul 1 cu o marjă de încredere de 99,7%.
Soluţie
Eroarea de eșantionare cu încredere de 99,7% este 3 σ / √n, care, de exemplu, este E = 3 * 0,15 kg = 0,45 kg. De aici rezultă că 99,7% dintre nou-născuți vor avea greutăți cuprinse între 2.650 kg și 3.550 kg.
- Exemplul 4
Determinați factorul Zy pentru un nivel de încredere de 75%. Determinați marja de eroare de eșantionare cu acest nivel de fiabilitate pentru cazul prezentat în Exemplul 1.
Soluţie
Nivelul de încredere este γ = 75% = 0,75, care este legat de nivelul de semnificație α prin relația γ = (1 - α), astfel încât nivelul de semnificație este α = 1 - 0,75 = 0 , 25.
Aceasta înseamnă că probabilitatea normală cumulată între -∞ și Zγ este:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Ceea ce corespunde unei valori Zy de 1.1503, așa cum se arată în figura 3.
Figura 3. Determinarea factorului Zy care corespunde unui nivel de încredere de 75%. Sursa: F. Zapata prin Geogebra.
Cu alte cuvinte, eroarea de eșantionare este E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Atunci când sunt aplicate la datele din exemplul 1, apare o eroare de:
E = 1,15 * 0,15 kg = 0,17 kg
Cu un nivel de încredere de 75%.
- Exercițiul 5
Care este nivelul de încredere dacă Z α / 2 = 2.4?
Soluţie
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2.4) = 1 - α / 2 = 0.9918 → α / 2 = 1 - 0.9918 = 0.0082 → α = 0.0164
Nivelul de semnificație este:
α = 0,0164 = 1,64%
Și în final, nivelul de încredere rămâne:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Referințe
- Canavos, G. 1988. Probabilitate și statistici: aplicații și metode. McGraw Hill.
- Devore, J. 2012. Probabilitatea și statisticile pentru inginerie și știință. 8-a. Ediție. Cengage.
- Levin, R. 1988. Statistici pentru administratori. 2a. Ediție. Sala Prentice.
- Sudman, S. 1982. Pune întrebări: un ghid practic pentru proiectarea chestionarului. San Francisco. Jossey Bass.
- Walpole, R. 2007. Probabilitatea și statisticile pentru inginerie și științe. Pearson.
- Wonnacott, TH și RJ Wonnacott. 1990. Statistici introductive. 5 Ed. Wiley
- Wikipedia. Eroare de eșantionare. Recuperat din: en.wikipedia.com
- Wikipedia. Marja de eroare. Recuperat din: en.wikipedia.com