- Distribuția frecvențelor
- Câte clase să ia în considerare?
- Cum se obține?
- Exemplu
- Pentru ce este?
- Exemplu
- Referințe
Marcajul clasei , cunoscut și sub denumirea de punct de mijloc, este valoarea din centrul unei clase, care reprezintă toate valorile care se află în acea categorie. În mod fundamental, marca de clasă este utilizată pentru a calcula anumiți parametri, cum ar fi media aritmetică sau abaterea standard.
Deci nota de clasă este punctul mediu al oricărui interval. Această valoare este de asemenea foarte utilă pentru a găsi variația unui set de date deja grupate în clase, ceea ce la rândul nostru ne permite să înțelegem cât de departe de centru sunt localizate aceste date specifice.
Distribuția frecvențelor
Pentru a înțelege ce este o marcă de clasă, conceptul de distribuție a frecvenței este necesar. Dat fiind un set de date, o distribuție de frecvență este un tabel care împarte datele într-un număr de categorii numite clase.
Acest tabel prezintă numărul de elemente care aparțin fiecărei clase; aceasta din urmă este cunoscută sub numele de frecvență.
Acest tabel sacrifică o parte din informațiile pe care le obținem din date, deoarece în loc să avem valoarea individuală a fiecărui element, știm doar că aparține clasei respective.
Pe de altă parte, obținem o mai bună înțelegere a setului de date, deoarece în acest fel este mai ușor să apreciem tiparele stabilite, ceea ce facilitează manipularea datelor respective.
Câte clase să ia în considerare?
Pentru a efectua o distribuție de frecvență, trebuie să stabilim mai întâi numărul de clase pe care vrem să le luăm și să alegem limitele clasei lor.
Alegerea câtor clase de curs trebuie să fie convenabilă, ținând cont de faptul că un număr mic de clase poate ascunde informații despre datele pe care vrem să le studiem și una foarte mare poate genera prea multe detalii care nu sunt neapărat utile.
Factorii de care trebuie să ținem cont atunci când alegem câte clase să luăm sunt mai multe, dar dintre acești doi ies în evidență: primul este să luăm în considerare câte date trebuie să luăm în considerare; a doua este să știm cât de mare este domeniul distribuției (adică diferența dintre cea mai mare și cea mai mică observație).
După ce clasele sunt deja definite, vom continua să numărăm câte date există în fiecare clasă. Acest număr se numește frecvența claselor și este notat cu fi.
Așa cum am spus anterior, avem o distribuție de frecvență pierde informațiile care provin individual din fiecare date sau observații. Din acest motiv, se caută o valoare care să reprezinte întreaga clasă din care face parte; această valoare este nota de clasă.
Cum se obține?
Marcajul clasei este valoarea de bază pe care o reprezintă o clasă. Se obține adăugând limitele intervalului și împărțind această valoare în două. Am putea exprima acest aspect matematic după cum urmează:
x i = (Limită inferioară + Limită superioară) / 2.
În această expresie x i notează nota clasei ith.
Exemplu
Având în vedere următorul set de date, acordați o distribuție de frecvență reprezentativă și obțineți nota de clasă corespunzătoare.
Deoarece datele cu cea mai mare valoare numerică este 391 și cea mai mică este 221, avem că intervalul este 391 -221 = 170.
Vom alege 5 clase, toate cu aceeași dimensiune. O modalitate de a alege clase este următoarea:
Rețineți că fiecare date se află într-o clasă, acestea sunt disjuncte și au aceeași valoare. Un alt mod de a alege clasele este luând în considerare datele ca făcând parte dintr-o variabilă continuă, care ar putea atinge orice valoare reală. În acest caz, putem lua în considerare clasele formei:
205-245, 245-285, 285-325, 325-365, 365-405
Cu toate acestea, acest mod de grupare a datelor poate prezenta unele ambiguități cu limitele. De exemplu, în cazul lui 245, se pune întrebarea: din ce clasă aparține, prima sau a doua?
Pentru a evita această confuzie, se face o convenție finală. În acest fel, prima clasă va fi intervalul (205,245], a doua (245,285) și așa mai departe.
Odată definite clasele, procedăm la calcularea frecvenței și avem următorul tabel:
După obținerea distribuției de frecvență a datelor, procedăm la găsirea semnelor de clasă pentru fiecare interval. De fapt, trebuie să:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
Putem reprezenta acest lucru prin graficul următor:
Pentru ce este?
După cum am menționat anterior, marca de clasă este foarte funcțională pentru a găsi media aritmetică și variația unui grup de date care au fost deja grupate în clase diferite.
Putem defini media aritmetică ca suma observațiilor obținute între mărimea eșantionului. Din punct de vedere fizic, interpretarea sa este ca punctul de echilibru al unui set de date.
Identificarea unui întreg set de date de un singur număr poate fi riscantă, deci trebuie luată în considerare și diferența dintre acest punct de respingere și datele reale. Aceste valori sunt cunoscute sub denumirea de abatere de la media aritmetică și cu acestea căutăm să determinăm cât de mult variază media aritmetică a datelor.
Cea mai comună modalitate de a găsi această valoare este prin variație, care este media pătratelor abaterilor de la media aritmetică.
Pentru a calcula media aritmetică și variația unui set de date grupate într-o clasă, utilizăm următoarele formule, respectiv:
În aceste expresii x i este marca de clasă a i-a, f i reprezintă frecvența corespunzătoare și k numărul de clase în care au fost grupate datele.
Exemplu
Folosind datele date în exemplul precedent, trebuie să putem extinde puțin mai mult datele din tabelul de distribuție a frecvențelor. Obțineți următoarele:
Apoi, înlocuind datele din formulă, rămânem cu media aritmetică ca:
Varianța și abaterea standard sunt:
Din aceasta putem concluziona că datele originale au o medie aritmetică de 306,6 și o abatere standard de 39,56.
Referințe
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Statistici descriptive. Editorial Esic.
- Jhonson Richard A. Miller și Freund Probabilitatea și oamenii de stat pentru ingineri. Pearson Education.
- Miller I & Freund J. Probabilitatea și oamenii de stat pentru ingineri. REVENI.
- Sarabia A. Jose Maria, Pascual Marta. Curs de statistică de bază pentru companii
- Llinás S. Humberto, Rojas A. Carlos Statistici descriptive și distribuții de probabilitate, Universidad del Norte Editorial