- Date grupate
- Exemplu
- Cele 3 măsuri principale ale tendinței centrale
- 1- Media aritmetică
- 2- Mediu
- 3- Moda
- Referințe
În Măsurile tendinței centrale a datelor grupate sunt utilizate în statistici pentru a descrie anumite comportamente ale unui grup de date furnizate, cum ar fi ce valori sunt aproape de, ceea ce este media datelor colectate, printre altele.
Atunci când luați o cantitate mare de date, este util să le grupați pentru a avea o ordine mai bună a acestora și astfel să puteți calcula anumite măsuri de tendință centrală.
Printre cele mai utilizate măsuri de tendință centrală se numără media aritmetică, mediana și modul. Aceste numere spun anumite calități despre datele colectate într-un anumit experiment.
Pentru a utiliza aceste măsuri, trebuie să știți mai întâi cum să grupați un set de date.
Date grupate
Pentru a grupa date, trebuie să calculați mai întâi intervalul de date, care se obține scăzând cea mai mare valoare minus cea mai mică valoare a datelor.
Apoi este ales un număr „k”, care este numărul de clase în care dorim să grupăm datele.
Intervalul este împărțit la „k” pentru a obține amplitudinea claselor care urmează să fie grupate. Acest număr este C = R / k.
În cele din urmă, începe gruparea, pentru care se alege un număr mai mic decât cea mai mică valoare a datelor obținute.
Acest număr va fi limita inferioară a primei clase. La aceasta se adaugă C. Valoarea obținută va fi limita superioară a primei clase.
Apoi, la această valoare se adaugă C și se obține limita superioară a celei de-a doua clase. În acest fel, vom continua să obținem limita superioară a ultimei clase.
După ce datele sunt grupate, media, mediul și modul pot fi calculate.
Pentru a ilustra modul în care media aritmetică, mediana și modul sunt calculate, vom continua cu un exemplu.
Exemplu
Prin urmare, atunci când grupați datele, se va obține un tabel precum următorul:
Cele 3 măsuri principale ale tendinței centrale
Acum vom continua să calculăm media aritmetică, mediana și modul. Exemplul de mai sus va fi utilizat pentru a ilustra această procedură.
1- Media aritmetică
Media aritmetică constă în multiplicarea fiecărei frecvențe cu media intervalului. Apoi, toate aceste rezultate sunt adăugate și, în final, este împărțit la datele totale.
Folosind exemplul anterior, s-ar obține că media aritmetică este egală cu:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Aceasta indică faptul că valoarea medie a datelor din tabel este 5.11111.
2- Mediu
Pentru a calcula mediul unui set de date, mai întâi comandăm toate datele de la cel puțin la cel mai mare. Două cazuri pot apărea:
- Dacă numărul de date este ciudat, atunci mediana este cea care se află în centru.
- Dacă numărul de date este egal, atunci mediana este media celor două date care se află în centru.
Când vine vorba de date grupate, calculul medianului se face după cum urmează:
- N / 2 este calculat, unde N este totalul datelor.
- Primul interval în care este căutată frecvența acumulată (suma frecvențelor) mai mare decât N / 2 și se selectează limita inferioară a acestui interval, numită Li.
Mediana este dată de următoarea formulă:
Me = Li + (Ls-Li) * (N / 2 - Frecvența acumulată înainte de Li) / frecvența [Li, Ls)
Ls este limita superioară a intervalului menționat mai sus.
Dacă se folosește tabelul de date anterioare, N / 2 = 18/2 = 9. Frecvențele acumulate sunt 4, 8, 14 și 18 (una pentru fiecare rând al tabelului).
Prin urmare, al treilea interval trebuie selectat, deoarece frecvența cumulată este mai mare decât N / 2 = 9.
Deci Li = 5 și Ls = 7. Aplicând formula descrisă mai sus, trebuie să:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3- Moda
Modul este valoarea care are cea mai mare frecvență dintre toate datele grupate; adică este valoarea care se repetă de cele mai multe ori în setul de date inițiale.
Când aveți o cantitate foarte mare de date, formula următoare este utilizată pentru calcularea modului de date grupate:
Mo = Li + (Ls-Li) * (frecvența Li - Frecvența L (i-1)) / ((frecvența Li - Frecvența L (i-1)) + + (frecvența Li - Frecvența L ( i + 1)))
Intervalul [Li, Ls) este intervalul în care se găsește cea mai mare frecvență. Pentru exemplul realizat în acest articol, modul este dat de:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
O altă formulă folosită pentru a obține o valoare aproximativă a modului este următoarea:
Mo = Li + (Ls-Li) * (frecvența L (i + 1)) / (frecvența L (i-1) + frecvența L (i + 1)).
Cu această formulă, conturile sunt următoarele:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referințe
- Bellhouse, DR (2011). Abraham De Moivre: Setarea scenei pentru probabilitatea clasică și aplicațiile sale. CRC Press.
- Cifuentes, JF (2002). Introducere în teoria probabilității. Universitatea Națională din Columbia.
- Daston, L. (1995). Probabilitatea clasică în iluminare. Presa universitară Princeton.
- Larson, HJ (1978). Introducere în teoria probabilității și inferențe statistice. Editorial Limusa.
- Martel, PJ, & Vegas, FJ (1996). Probabilitatea și statisticile matematice: aplicații în practica clinică și managementul sănătății. Ediții Díaz de Santos.
- Vázquez, AL, & Ortiz, FJ (2005). Metode statistice pentru măsurarea, descrierea și controlul variabilității. Ed. Universitatea Cantabria.
- Vázquez, SG (2009). Manual de Matematică pentru acces la Universitate. Editorial Centro de Studii Ramon Areces SA.