- Definiție
- Formule și ecuații
- - Kurtosis conform prezentării datelor
- Date care nu sunt grupate sau grupate în frecvențe
- Date grupate în intervale
- Excesul de kurtoză
- Pentru ce este kurtoza?
- Salariile a 3 departamente
- Rezultatele unui examen
- Exemplu lucrat de kurtoză
- Soluţie
- Pasul 1
- Pasul 2
- Pasul 3
- Referințe
Coeficientul de boltire sau coeficientul de boltire este un parametru statistic utilizat pentru caracterizarea distribuției de probabilitate a unei variabile aleatoare, care indică gradul de concentrare a valorilor în jurul măsura centrală. Aceasta este cunoscută și sub denumirea de „gradul de vârf”.
Termenul provine din grecescul "kurtos", care înseamnă arcuit, de aceea kurtosis indică gradul de îndreptare sau aplatizare a distribuției, așa cum se vede în figura următoare:
Figura 1. Diferite tipuri de kurtoză. Sursa: F. Zapata.
Aproape toate valorile unei variabile aleatorii tind să se aglomereze în jurul unei valori centrale, cum ar fi media. Dar, în unele distribuții, valorile sunt mai dispersate decât în altele, rezultând curbe mai plane sau mai subțiri.
Definiție
Kurtosis este o valoare numerică tipică pentru fiecare distribuție de frecvență, care, în funcție de concentrația valorilor din jurul mediei, sunt clasificate în trei grupuri:
- Leptokurtic: în care valorile sunt foarte grupate în jurul valorii medii, astfel încât distribuția este destul de indicată și zveltă (figura 1, stânga).
- Mesocúrtic: are o concentrație moderată de valori în jurul valorii medii (figura 1 în centru).
- Platicúrtica: această distribuție are o formă mai largă, deoarece valorile tind să fie mai dispersate (figura 1 din dreapta).
Formule și ecuații
Kurtosis poate avea orice valoare, fără limitări. Calculul acesteia se efectuează în funcție de modul de livrare a datelor. Notarea folosită în fiecare caz este următoarea:
-Coficient de kurtoză: g 2
-Media medie aritmetică: X sau x cu bară
-O valoare a i-a: x i
-Avierea standard: σ
-Numărul de date: N
-Frecvența valorii i-a: f i
-Marcă de clasă: mx i
Cu această notare, vă prezentăm unele dintre cele mai utilizate formule pentru a găsi kurtosis:
- Kurtosis conform prezentării datelor
Date care nu sunt grupate sau grupate în frecvențe
Date grupate în intervale
Excesul de kurtoză
Numit și coeficientul de direcționare al lui Fisher sau măsura lui Fisher, este utilizat pentru a compara distribuția studiată cu distribuția normală.
Când excesul de kurtoză este 0, suntem în prezența unei distribuții normale sau a unui clopot gaussian. În acest fel, ori de câte ori este calculată excesul de kurtoză a unei distribuții, o comparăm de fapt cu distribuția normală.
Atât pentru datele neagrupate, cât și pentru cele reunite, coeficientul de indicare al lui Fisher, notat cu K, este:
K = g 2 - 3
Acum, se poate demonstra că kurtoza distribuției normale este 3, prin urmare, dacă coeficientul de indicare Fisher este 0 sau apropiat de 0 și există o distribuție mesocructică. Dacă K> 0 distribuția este leptokurtică și dacă K <0 este platicúrtică.
Pentru ce este kurtoza?
Kurtosis este o măsură a variabilității utilizate pentru a caracteriza morfologia unei distribuții. În acest fel, se pot compara distribuții simetrice cu aceeași medie și aceeași dispersie (dată de abaterea standard).
A lua măsuri de variabilitate asigură că mediile sunt fiabile și ajută la controlul variațiilor în distribuție. Ca exemplu, să analizăm aceste două situații.
Salariile a 3 departamente
Să presupunem că graficul următor arată distribuțiile salariale ale 3 departamente ale aceleiași companii:
Figura 2. Trei distribuții cu kurtoză diferită ilustrează situații practice. (Pregătit de Fanny Zapata)
Curba A este cea mai slabă dintre toate și din forma sa se poate deduce că majoritatea salariilor departamentului respectiv sunt foarte apropiate de medie, prin urmare, majoritatea angajaților primesc o compensație similară.
La rândul său, în departamentul B, curba salariului urmărește o distribuție normală, deoarece curba este mesocurtică, în care presupunem că salariile au fost distribuite aleatoriu.
Și, în sfârșit, avem curba C, care este foarte plată, semn că în acest departament, salariul este mult mai larg decât în celelalte.
Rezultatele unui examen
Să presupunem acum că cele trei curbe din figura 2 reprezintă rezultatele unui examen aplicat la trei grupuri de studenți ai aceluiași subiect.
Grupul ale cărui evaluări sunt reprezentate de o curbă leptokurtică este destul de omogen, majoritatea obținând un rating mediu sau apropiat.
De asemenea, este posibil ca rezultatul să se datoreze întrebărilor test care au mai mult sau mai puțin același grad de dificultate.
Pe de altă parte, rezultatele grupului C indică o eterogenitate mai mare în grup, care conține probabil studenți medii, unii studenți mai avansați și, cu siguranță, aceiași mai puțin atenți.
Sau ar putea însemna că întrebările de test au avut grade de dificultate foarte diferite.
Curba B este mesocutică, indicând faptul că rezultatele testului au urmat o distribuție normală. Acesta este de obicei cel mai frecvent caz.
Exemplu lucrat de kurtoză
Găsiți coeficientul de notare al Fisher pentru următoarele note, obținut la un examen de fizică la un grup de studenți, cu o scală de la 1 la 10:
Soluţie
Următoarea expresie va fi utilizată pentru datele care nu sunt grupate, date în secțiunile precedente:
K = g 2 - 3
Această valoare vă permite să cunoașteți tipul de distribuție.
Pentru a calcula g 2 este convenabil să se facă într-un mod ordonat, pas cu pas, deoarece mai multe operații aritmetice trebuie rezolvate.
Pasul 1
În primul rând, se calculează media notelor. Există N = 11 date.
Pasul 2
Se găsește abaterea standard, pentru care se utilizează această ecuație:
σ = 1.992
Sau puteți, de asemenea, să construiți un tabel, care este necesar și pentru pasul următor și în care se scrie fiecare termen al rezumărilor care vor fi necesare, începând cu (x i - X), apoi (x i - X) 2 și apoi (x i - X) 4 :
Pasul 3
Efectuați suma indicată în numărătorul formulei pentru g 2 . Pentru aceasta, se folosește rezultatul coloanei din dreapta a tabelului precedent:
∑ (x i - X) 4 = 290,15
Prin urmare:
g 2 = (1/11) x 290,15 / 1,992 4 = 1,675
Coeficientul de indicare al lui Fisher este:
K = g 2 - 3 = 1.675 - 3 = -1,325
Ceea ce este de interes este semnul rezultatului, care, fiind negativ, corespunde unei distribuții platicúrtice, care poate fi interpretată așa cum s-a făcut în exemplul precedent: posibil este un curs eterogen cu studenți de diferite grade de interes sau întrebările de examinare au fost de diferite niveluri de dificultate.
Utilizarea unei foi de calcul, cum ar fi Excel, facilitează foarte mult rezolvarea acestor tipuri de probleme și oferă, de asemenea, opțiunea de a grafica distribuția.
Referințe
- Levin, R. 1988. Statistici pentru administratori. 2a. Ediție. Sala Prentice.
- Marco, F. Curtosis. Recuperat din: economia.com.
- Oliva, J. Asimetrie și kurtoză. Recuperat de la: statisticaucv.files.wordpress.com.
- Spurr, W. 1982. Luarea deciziilor în management. Limusa.
- Wikipedia. Aplatizării. Recuperat de la: en.wikipedia.org.