- Avantaje și dezavantaje
- Dezavantaje ale intervalului ca măsură a dispersiei
- Gama interquartile, quartile și exemplu lucrat
- - Calculul quartilelor
- Primul quartile
- Al doilea quartile sau median
- Al treilea quartile
- Exemplu lucrat
- Solutie la
- Soluție b
- Soluție c
- Referințe
Interval , distanța sau amplitudinea, în statistici, este diferența (scădere) între valoarea maximă și valoarea minimă a unui set de date dintr - un eșantion sau o populație. Dacă intervalul este reprezentat de litera R și datele sunt reprezentate de x, formula pentru interval este pur și simplu:
R = x max - x min
În cazul în care x max este valoarea maximă a datelor și x min este minimă.
Figura 1. Gama de date corespunzătoare populației din Cádiz în ultimele două secole. Sursa: Wikimedia Commons.
Conceptul este foarte util ca o simplă măsură de dispersie pentru a aprecia rapid variabilitatea datelor, deoarece indică extensia sau lungimea intervalului în care se găsesc acestea.
De exemplu, să presupunem că este măsurată înălțimea unui grup de 25 de studenți de sex masculin din anul I la o universitate. Cel mai înalt elev din grupă este 1,93 m, iar cel mai scurt 1,67 m. Acestea sunt valorile extreme ale datelor eșantion, de aceea calea lor este:
R = 1,93 - 1,67 m = 0,26 m sau 26 cm.
Înălțimea studenților din acest grup este distribuită de-a lungul acestui interval.
Avantaje și dezavantaje
Intervalul este, așa cum am spus anterior, o măsură a răspândirii datelor. Un interval mic indică faptul că datele sunt mai mult sau mai puțin apropiate, iar răspândirea este redusă. Pe de altă parte, o gamă mai mare indică faptul că datele sunt mai dispersate.
Avantajele calculului intervalului sunt evidente: este foarte ușor și rapid de găsit, deoarece este o diferență simplă.
De asemenea, are aceleași unități ca și datele cu care funcționează, iar conceptul este foarte ușor de interpretat pentru orice observator.
În exemplul înălțimii studenților de inginerie, dacă intervalul ar fi fost de 5 cm, am spune că studenții au aproximativ aceeași dimensiune. Dar cu o rază de acțiune de 26 cm, presupunem imediat că există probe de toate înălțimile intermediare în probă. Această presupunere este întotdeauna corectă?
Dezavantaje ale intervalului ca măsură a dispersiei
Dacă privim cu atenție, s-ar putea ca în eșantionul nostru de 25 de studenți de inginerie, doar unul dintre ei să măsoare 1,93, iar restul de 24 să aibă înălțimi apropiate de 1,67 m.
Și totuși domeniul rămâne același, deși opusul este perfect posibil: faptul că înălțimea majorității este în jur de 1,90 m și doar unul este de 1,67 m.
În ambele cazuri, distribuția datelor este diferită.
Dezavantajele intervalului ca măsură de dispersie se datorează faptului că folosește doar valori extreme și ignoră toate celelalte. Deoarece majoritatea informațiilor sunt pierdute, nu aveți idee despre modul în care datele de probă sunt distribuite.
O altă caracteristică importantă este că intervalul eșantionului nu scade niciodată. Dacă adăugăm mai multe informații, adică avem în vedere mai multe date, intervalul crește sau rămâne același.
Și, în orice caz, este util doar atunci când lucrați cu probe mici, utilizarea sa exclusivă ca măsură de dispersie în probe mari nu este recomandată.
Ceea ce trebuie făcut este să-l completăm cu calculul altor măsuri de dispersie care țin cont de informațiile furnizate de datele totale: intervalul interquartil, variația, abaterea standard și coeficientul de variație.
Gama interquartile, quartile și exemplu lucrat
Ne-am dat seama că slăbiciunea gamei ca măsură de dispersie este aceea că folosește doar valorile extreme ale distribuției datelor, omitând celelalte.
Pentru a evita acest inconvenient, se folosesc quartile: trei valori cunoscute sub numele de măsuri de poziție.
Acestea distribuie datele ne grupate în patru părți (alte măsuri de poziție utilizate pe scară largă sunt decile și percentile). Acestea sunt caracteristicile sale:
-Primul quartile Q 1 este valoarea datelor astfel încât 25% din toate sunt mai mici decât Q 1 .
-Alta quartile Q 2 este mediana distribuției, ceea ce înseamnă că jumătate (50%) din date este mai mică decât această valoare.
-În, treimea inferioară Q 3 indică faptul că 75% din date sunt mai mici decât Q 3 .
Apoi, intervalul interquartile sau intervalul interquartile este definit ca diferența dintre al treilea quartile Q 3 și primul quartile Q 1 al datelor:
Interval interquartile = R Q = Q 3 - Q 1
În acest fel, valoarea intervalului R Q nu este atât de afectată de valorile extreme. Din acest motiv, este recomandabil să-l utilizați atunci când aveți de-a face cu distribuții înclinate, cum ar fi cele ale elevilor foarte înalți sau foarte scurti descriși mai sus.
- Calculul quartilelor
Există mai multe modalități de a le calcula, aici vom propune unul, dar în orice caz este necesar să cunoaștem numărul de ordine „N o ”, care este locul pe care îl ocupă quartilul respectiv în distribuție.
Adică dacă, de exemplu, termenul care corespunde Q 1 este al doilea, al treilea sau al patrulea și așa mai departe al distribuției.
Primul quartile
N sau (Q 1 ) = (N + 1) / 4
Al doilea quartile sau median
N sau (Q 2 ) = (N + 1) / 2
Al treilea quartile
N sau (Q 3 ) = 3 (N + 1) / 4
Unde N este numărul de date.
Mediana este valoarea care este chiar la mijlocul distribuției. Dacă numărul de date este ciudat, nu este nicio problemă în găsirea ei, dar dacă este egal, atunci cele două valori centrale sunt medii pentru a deveni una.
După calcularea numărului comenzii, se respectă una dintre aceste trei reguli:
-Dacă nu există zecimale, datele căutate în distribuție sunt căutate și acesta va fi cvileul căutat.
-Când numărul de ordine este la jumătatea distanței între două, atunci datele indicate de partea întreagă sunt mediate cu următoarele date, iar rezultatul este un cvartal corespunzător.
-În orice alt caz, este rotunjit la cel mai apropiat număr întreg și aceasta va fi poziția cvartilului.
Exemplu lucrat
Pe o scară de la 0 la 20, un grup de 16 studenți de matematică I au obținut următoarele note (puncte) la un examen de la jumătatea perioadei:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Găsi:
a) Intervalul sau intervalul de date.
b) Valorile quartilelor Q 1 și Q 3
c) Intervalul interquartil.
Figura 2. Scorurile la acest test de matematică au o variabilitate atât de mare? Sursa: Pixabay.
Solutie la
Primul lucru de făcut pentru a găsi ruta este să ordonați datele într-o ordine crescătoare sau descrescătoare. De exemplu, pentru a crește ordinea, aveți:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Folosind formula dată la început: R = x max - x min
R = 20 - 1 puncte = 19 puncte.
Conform rezultatului, aceste evaluări au o mare dispersie.
Soluție b
N = 16
N sau (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Este un număr cu zecimale, a cărui parte integrantă este 4. Apoi mergem la distribuție, căutăm datele care ocupă locul patru, iar valoarea acesteia este medie cu cea a poziției a cincea. Deoarece sunt ambii 9, media este de asemenea 9 și astfel:
Q 1 = 9
Acum repetăm procedura pentru a găsi Q 3 :
N sau (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Din nou este o zecimală, dar, întrucât nu este pe jumătate, este rotunjită la 13. Cvartalul căutat ocupă poziția a treisprezecea și este:
Q 3 = 16
Soluție c
R Q = Q 3 - Q 1 = 16 - 9 = 7 puncte.
Care, după cum putem vedea, este mult mai mic decât intervalul de date calculat la secțiunea a), deoarece scorul minim a fost de 1 punct, o valoare mult mai departe de restul.
Referințe
- Berenson, M. 1985. Statistici pentru management și economie. Interamericana SA
- Canavos, G. 1988. Probabilitate și statistică: aplicații și metode. McGraw Hill.
- Devore, J. 2012. Probabilitatea și statisticile pentru inginerie și știință. 8-a. Ediție. Cengage.
- Exemple de quartile. Recuperat de la: matematicas10.net.
- Levin, R. 1988. Statistici pentru administratori. 2a. Ediție. Sala Prentice.
- Walpole, R. 2007. Probabilitatea și statisticile pentru inginerie și științe. Pearson.