- Exemple
- Clasificarea variabilelor categorice
- Categorii nominale
- Ordinal categoric
- Categorii binare
- Statistici cu variabile categorice
- Reprezentarea grafică a variabilelor categorice
- Exerciții rezolvate
- Exercitiul 1
- Exemplul 2
- Exemplul 3
- Referințe
Variabila categorică este cea utilizată în statisticile pentru a atribui o caracteristică de bază non-numerică sau calitativă sau a proprietății la un obiect, persoană, entitate, condiție sau procedură. Este posibil să definiți toate tipurile de variabile categorice în funcție de fiecare nevoie.
Exemple de variabile categorice sunt: culoarea, sexul, grupa sanguină, starea civilă, tipul materialului, forma de plată sau tipul de cont bancar, iar acestea sunt folosite foarte mult zilnic.
Figura 1: Culoarea este o variabilă categorică. Sursa: pixabay
Cele de mai sus sunt variabilele, dar valorile lor posibile sunt calitative, adică de calitate sau caracteristice și nu de măsurare numerică. De exemplu, valorile posibile pentru sexul variabil sunt: bărbat, h îmbrățișare.
Când această variabilă este stocată într-un program de calculator, ea poate fi declarată ca o variabilă text și singurele valori acceptate vor fi cele numite deja: Bărbat, Femeie.
Cu toate acestea, același sex variabil poate fi declarat și păstrat ca un număr întreg dacă Masculului i se atribuie 1 și Femeii i se atribuie valoarea 2. Din acest motiv, variabilele categorice sunt uneori denumite un tip enumerat.
Principala caracteristică a variabilelor categorice este aceea că, spre deosebire de alte variabile, cum ar fi variabilele continue și discrete, nu este posibilă realizarea aritmetică cu ele. Cu toate acestea, se pot face statistici cu acestea, așa cum se va vedea mai târziu.
Exemple
Rețineți următoarele exemple de variabile categorice și valorile posibile ale acestora:
- Group_Sanguíneo, Interval de valori: A, B, AB, O
- Civil_Status, valori categorice: single (A), căsătorit (B), văduv (C), divortat (D).
- Tipo_de_Material, Categorii sau valori: 1 = Lemn, 2 = Metal, 3 = Plastic
-Form_of_Payment, valori mobiliare sau categorii: (1) Numerar, (2) Debit, (3) Transfer, (4) Credit
În exemplele anterioare, un număr a fost asociat cu fiecare categorie într-un mod complet arbitrar.
Atunci s-ar putea crede că această asociere numerică arbitrară o face echivalentă cu o variabilă cantitativă discretă, dar nu este, deoarece operațiunile aritmetice nu se pot face cu aceste numere.
Pentru a ilustra ideea, în variabila Form_of_Payment, operația sumei nu are sens:
(1) Numerar + (2) Debitul nu va fi niciodată egal (3) Transfer
Clasificarea variabilelor categorice
Clasamentul se bazează pe faptul că au sau nu o ierarhie implicită sau dacă numărul rezultatelor posibile este mai mult de doi sau doi.
O variabilă categorică cu un singur rezultat posibil nu este o variabilă, ci o constantă categorică.
Categorii nominale
Când acestea nu pot fi reprezentate de un număr sau nu au o comandă. De exemplu, variabila: Type_of_Material, are valori nominale (lemn, metal, plastic), nu au ierarhie sau ordine, chiar și atunci când un număr arbitrar este atribuit fiecărui răspuns sau categorie.
Ordinal categoric
Variabilă: Academic_performance
Valori nominale: ridicat, mediu, scăzut
Deși valorile acestei variabile nu sunt numerice, ele au o ordine sau ierarhie implicită.
Categorii binare
Acestea sunt variabile nominale cu două răspunsuri posibile, de exemplu:
-Variabil: Răspuns
-Valoane nominale: Adevărat, Fals
Rețineți că variabila de răspuns nu are o ierarhie implicită și are doar două rezultate posibile, deci este o variabilă categorică binară.
Unii autori numesc acest tip o variabilă binară și nu consideră că aparține unor variabile categorice care sunt limitate la cele cu mai mult de trei categorii posibile.
Statistici cu variabile categorice
Statisticile pot fi realizate cu variabile categorice, deși nu sunt variabile numerice sau cantitative. De exemplu, pentru a cunoaște tendința sau valoarea cea mai probabilă a unei variabile categorice, modul este luat.
Modul este, în acest caz, rezultatul sau valoarea cea mai repetată a unei variabile categorice. Pentru variabilele categorice, nu este posibil să se calculeze nici media, nici mediana.
Media nu poate fi calculată, deoarece nu puteți face aritmetică cu variabile categorice. Nici mediana nu este, deoarece variabilele cantitative sau categorice nu au o ordine sau ierarhie, deci nu este posibilă determinarea unei valori centrale.
Reprezentarea grafică a variabilelor categorice
Având în vedere o anumită variabilă categorică, se poate găsi frecvența sau numărul de ori cu care se repetă un rezultat al acestei variabile. Dacă se face acest lucru pentru fiecare rezultat, atunci se poate face un grafic al frecvenței față de fiecare categorie sau rezultat.
Iată câteva exemple despre modul în care variabilele categorice pot fi reprezentate grafic.
Exerciții rezolvate
Exercitiul 1
O companie are înregistrări ale datelor de 170 de angajați. Una dintre variabilele care se află în aceste înregistrări este: Estado_Civil. Această variabilă are patru categorii sau valori posibile:
Single (A), Căsătorit (B), văduv (C), Divorțat (D).
Deși este o variabilă non-numerică, este posibil să știm câte dintre înregistrările totale sunt într-o anumită categorie și să fie reprezentate sub forma unui grafic de bare, așa cum se arată în figura următoare:
Figura 2. Reprezentarea rezultatelor unei variabile categorice. Sursa: creată de sine
Exemplul 2
Un magazin de încălțăminte ține evidența vânzărilor sale. Printre variabilele care își gestionează înregistrările se numără culoarea pantofului pentru fiecare model. Variabila:
Color_Shoe_Model_AW3
Este de tip categoric și are cinci categorii sau valori posibile. Numărul de vânzări este totalizat pentru fiecare categorie a acestei variabile și se stabilește procentul acestora. Rezultatele sunt prezentate în graficul următoarei figuri:
Figura 3. Variabilă categorică Culoare _Shoe. În această variabilă, modul este Alb. Sursa: creată de sine.
Se poate spune atunci că modelul de pantofi AW3 care este la modă, cel care se vinde cel mai frecvent este Alb, urmat îndeaproape de Negru.
Se mai poate spune că, cu o probabilitate de 70%, următorul pantof care se vinde din acest model va fi Alb sau Negru.
Aceste informații pot fi utile pentru magazin atunci când plasați noi comenzi sau poate chiar aplica reduceri la culorile cel mai puțin vândute din cauza excesului de inventar.
Exemplul 3
Pentru o anumită populație de donatori de sânge, doriți să reprezentați numărul de persoane care aparțin unei anumite grupe de sânge. O modalitate grafică de vizualizare a rezultatelor este prin intermediul unei pictograme, care este în partea de jos a unui tabel.
Prima coloană reprezintă variabila group_sanguíneo și rezultatele sau categoriile sale posibile. A doua coloană are reprezentarea în formă iconică sau picturală a numărului de persoane din fiecare categorie. În exemplul nostru, o picătură roșie este folosită ca pictogramă, fiecare reprezentând 10 persoane.
Figura 4. Pictogramă. Sursa: creată de sine
Referințe
- Academia Khan. Analiza datelor categorice. Recuperat de la: khanacademy.org
- Formule de univers. Variabilă calitativă. Recuperat de la: univesoformulas.com
- Minitab. Care sunt variabile categorice, discrete și continue. Recuperat de la: support.minitab.com
- Tutorial Excel. Caracterizarea variabilelor. Recuperat de la: help.xlslat.com.
- Wikipedia. Variabilă statistică. Recuperat de pe wikipedia.com
- Wikipedia. Variabilă categorică. Recuperat de pe wikipedia.com
- Wikipedia. Variabilă categorică. Recuperat de pe wikipedia.com