- Tipuri de grade de libertate
- Într-o carcasă mecanică
- Într-un set de valori aleatorii
- Exemple
- Varianță și grade de libertate
- În distribuția pătratului Chi
- În testul de ipoteză (cu exemplu rezolvat)
- Referințe
De grade de libertate în statisticile sunt numărul de componente independente ale unui vector aleator. Dacă vectorul are n componente și există p ecuații liniare legate de componentele sale, atunci gradul de libertate este np.
Conceptul de grade de libertate apare și în mecanica teoretică, unde acestea sunt aproximativ echivalente cu dimensiunea spațiului în care se mișcă particulele, cu numărul de legături.
Figura 1. Un pendul se mișcă în două dimensiuni, dar are un singur grad de libertate, deoarece este forțat să se miște într-un arc de rază L. Sursa: F. Zapata.
Acest articol va discuta despre conceptul de grade de libertate aplicat statisticilor, dar un exemplu mecanic este mai ușor de vizualizat sub formă geometrică.
Tipuri de grade de libertate
În funcție de contextul în care se aplică, modul de calculare a numărului de grade de libertate poate varia, dar ideea care stă la baza este întotdeauna aceeași: dimensiuni totale mai puțin număr de restricții.
Într-o carcasă mecanică
Să luăm în considerare o particulă oscilantă legată de o sfoară (un pendul) care se mișcă în planul vertical xy (2 dimensiuni). Cu toate acestea, particula este forțată să se deplaseze pe circumferința unei raze egală cu lungimea coardei.
Deoarece particulele se pot deplasa doar pe acea curbă, numărul de grade de libertate este 1. Acest lucru poate fi văzut în figura 1.
Modul de calculare a numărului de grade de libertate este prin luarea diferenței numărului de dimensiuni minus numărul constrângerilor:
grade de libertate: = 2 (dimensiuni) - 1 (ligatura) = 1
O altă explicație care ne permite să ajungem la rezultat este următoarea:
-Știm că poziția în două dimensiuni este reprezentată de un punct de coordonate (x, y).
-Dar, deoarece punctul trebuie să respecte ecuația circumferinței (x 2 + y 2 = L 2 ) pentru o valoare dată a variabilei x, variabila y este determinată de ecuația sau restricția menționată.
În acest fel, doar una dintre variabile este independentă, iar sistemul are un (1) grad de libertate.
Într-un set de valori aleatorii
Pentru a ilustra ce înseamnă conceptul, să presupunem vectorul
x = (x 1 , x 2 , …, x n )
Reprezentând eșantionul de n valori aleatorii distribuite în mod normal. În acest caz, vectorul aleator x are n componente independente și , prin urmare , x este declarat a avea n grade de libertate.
Să construim acum vectorul r al reziduurilor
r = (x 1 -
Unde
Deci suma
(x 1 -
Este o ecuație care reprezintă o restricție (sau legare) în elementele vectorului r al reziduurilor, deoarece dacă sunt cunoscute n-1 componente ale vectorului r , ecuația de restricție determină componenta necunoscută.
Prin urmare, vectorul r al dimensiunii n cu restricția:
∑ (x i -
Are (n - 1) grade de libertate.
Din nou, se aplică faptul că calcularea numărului de grade de libertate este:
grade de libertate: = n (dimensiuni) - 1 (constrângeri) = n-1
Exemple
Varianță și grade de libertate
Varianța s 2 este definită ca media pătratului abaterilor (sau reziduurilor) eșantionului de n date:
s 2 = ( r • r ) / (n-1)
unde r este vectorul reziduurilor r = (x1 -
s 2 = ∑ (x i -
În orice caz, trebuie remarcat faptul că atunci când se calculează media pătratului reziduurilor, acesta este împărțit la (n-1) și nu la n, deoarece așa cum s-a discutat în secțiunea anterioară, numărul de grade de libertate ale vectorului r este ( n-1).
Dacă pentru calculul variației ar fi împărțit la n în loc de (n-1), rezultatul ar avea o părtinire care este foarte semnificativă pentru valori de n mai puțin de 50.
În literatura de specialitate, formula de varianță apare și cu divizorul n în loc de (n-1), când vine vorba de variația unei populații.
Dar mulțimea variabilei aleatoare a reziduurilor, reprezentată de vectorul r , deși are dimensiunea n, are doar (n-1) grade de libertate. Cu toate acestea, dacă numărul de date este suficient de mare (n> 500), ambele formule converg către același rezultat.
Calculatoarele și foile de calcul furnizează ambele versiuni ale variației și deviația standard (care este rădăcina pătrată a variației).
Recomandarea noastră, având în vedere analiza prezentată aici, este să alegem întotdeauna versiunea cu (n-1) de fiecare dată când este necesar să calculăm variația sau abaterea standard, pentru a evita rezultatele părtinitoare.
În distribuția pătratului Chi
Unele distribuții de probabilitate în variabilă aleatorie continuă depind de un parametru numit grad de libertate, acesta este cazul distribuției pătrate Chi (χ 2 ).
Numele acestui parametru provine tocmai din gradele de libertate ale vectorului aleator care stă la baza căruia se aplică această distribuție.
Să presupunem că avem populații g, din care se prelevează mostre de mărimea n:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
O populație j care are semnificații
Variabila standardizată sau normalizată zj i este definită ca:
zj i = (xj i -
Și vectorul Zj este definit astfel:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) și urmează distribuția normalizată normalizată N (0,1).
Deci variabila:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
urmează distribuția χ 2 (g) numită distribuția chi-pătrat cu grad de libertate g.
În testul de ipoteză (cu exemplu rezolvat)
Când doriți să testați ipoteze pe baza unui anumit set de date aleatorii, trebuie să cunoașteți numărul de grade de libertate g pentru a aplica testul Chi-square.
Figura 2. Există o relație între preferința înghețatei FLAVOR și GENERUL clientului? Sursa: F. Zapata.
Ca exemplu, vor fi analizate datele colectate cu privire la preferințele înghețatei cu ciocolată sau cu căpșuni în rândul bărbaților și femeilor dintr-o anumită înghețată. Frecvența cu care bărbații și femeile aleg căpșuna sau ciocolata este rezumată în figura 2.
În primul rând, se calculează tabelul frecvențelor preconizate, care este pregătit prin înmulțirea numărului de rânduri cu numărul total de coloane, împărțit la date totale. Rezultatul este prezentat în următoarea figură:
Figura 3. Calculul frecvențelor preconizate pe baza frecvențelor observate (valori în albastru în figura 2). Sursa: F. Zapata.
Apoi, pătratul Chi este calculat (din date) folosind următoarea formulă:
χ 2 = ∑ (F o - F e ) 2 / F e
Unde F o sunt frecvențele observate (Figura 2) și F e sunt frecvențele așteptate (Figura 3). Sumarea parcurge toate rândurile și coloanele, care în exemplul nostru dau patru termeni.
După efectuarea operațiunilor, primiți:
χ 2 = 0,2043.
Acum este necesar să se compare cu pătratul Chi teoretic, care depinde de numărul de grade de libertate g.
În cazul nostru, acest număr este determinat după cum urmează:
g = (# rânduri - 1) (# coloane - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Se dovedește că numărul de grade de libertate g în acest exemplu este 1.
Dacă doriți să verificați sau să respingeți ipoteza nulă (H0: nu există nicio corelație între TASTE și GEN) cu un nivel de semnificație de 1%, valoarea teoretică Chi-pătrat este calculată cu gradul de libertate g = 1.
Se caută valoarea care face ca frecvența acumulată (1 - 0,01) = 0,99, adică 99%. Această valoare (care poate fi obținută din tabele) este de 6.636.
Întrucât Chi teoretic îl depășește pe cel calculat, atunci ipoteza nulă este verificată.
Cu alte cuvinte, cu datele colectate, nu se observă nicio relație între variabilele TASTE și GEN.
Referințe
- Minitab. Care sunt gradele de libertate? Recuperat de la: support.minitab.com.
- Moore, David. (2009) Statistici de bază aplicate. Redactor Antoni Bosch.
- Leigh, Jennifer. Cum se calculează gradele de libertate în modelele statistice. Recuperat de la: geniolandia.com
- Wikipedia. Gradul de libertate (statistici). Recuperat din: es.wikipedia.com
- Wikipedia. Gradul de libertate (fizic). Recuperat din: es.wikipedia.com