- Declarația problemei în testul Mann-Whitney U
- Variabile calitative versus variabile cantitative
- Caz normal
- Caz cu tendință normală
- Eșantioane pereche sau nepereche
- Caracteristicile testului Mann Whitney U
- Mann - formula Whitney
- Pași pentru aplicarea testului
- Exemplu de aplicare practică
- - Pasul 1
- - Pasul 2
- Regiunea A
- Regiunea B
- Pasul 3
- Pasul 4
- Criterii de comparație
- Calculatoare online pentru testul Mann - Whitney U
- Referințe
Testul Mann - Whitney U este aplicat pentru compararea a două eșantioane independente atunci când au puține date sau nu urmează o distribuție normală. În acest fel, este considerat un test non-parametric, spre deosebire de omologul său, testul Student, care este utilizat atunci când eșantionul este suficient de mare și urmărește distribuția normală.
Frank Wilcoxon a propus-o pentru prima dată în 1945, pentru eșantioane de mărimi identice, dar doi ani mai târziu a fost extins pentru cazul eșantioanelor de diferite dimensiuni de către Henry Mann și DR Whitney.
Figura 1. Testul Mann-Whitney U este aplicat pentru compararea eșantioanelor independente. Sursa: Pixabay.
Testul este adesea aplicat pentru a verifica dacă există o relație între o variabilă calitativă și una cantitativă.
Un exemplu ilustrativ este acela de a lua un set de oameni hipertensivi și de a extrage două grupuri, din care se înregistrează zilnic date ale tensiunii arteriale timp de o lună.
Tratamentul A se aplică la o grupă și tratamentul B. Aici, tensiunea arterială este variabila cantitativă, iar tipul de tratament este cel calitativ.
Vrem să știm dacă mediana, și nu media, a valorilor măsurate este statistic aceeași sau diferită, pentru a stabili dacă există o diferență între ambele tratamente. Pentru a obține răspunsul, se aplică statistica Wilcoxon sau testul Mann - Whitney U.
Declarația problemei în testul Mann-Whitney U
Un alt exemplu în care testul poate fi aplicat este următorul:
Să presupunem că doriți să știți dacă consumul de băuturi răcoritoare diferă semnificativ în două regiuni ale țării.
Una dintre ele se numește regiunea A și cealaltă regiune B. Se ține o evidență a litrilor consumați săptămânal în două probe: unul din 10 persoane pentru regiunea A și altul de 5 persoane pentru regiunea B.
Datele sunt următoarele:
-Regiunea A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Regiunea B : 12,14, 11, 30, 10
Se ridică următoarea întrebare:
Variabile calitative versus variabile cantitative
-Variabilă calitativă X : Regiune
-Variabila cantitativă Y : consum de băuturi răcoritoare
Dacă cantitatea de litri consumată este aceeași în ambele regiuni, concluzia va fi că nu există nicio dependență între cele două variabile. Modul de a afla este de a compara media sau tendința medie pentru cele două regiuni.
Caz normal
Dacă datele urmează o distribuție normală, sunt propuse două ipoteze: H0 nul și alternativa H1 prin comparația dintre mijloace:
- H0 : nu există nicio diferență între media celor două regiuni.
- H1 : mijloacele ambelor regiuni sunt diferite.
Caz cu tendință normală
Dimpotrivă, dacă datele nu urmează o distribuție normală sau eșantionul este pur și simplu prea mic pentru a o cunoaște, în loc să compare media, ar fi comparată mediana celor două regiuni.
- H0 : nu există nicio diferență între mediana celor două regiuni.
- H1 : mediile ambelor regiuni sunt diferite.
Dacă medianele coincid, atunci ipoteza nulă este îndeplinită: nu există nicio relație între consumul de băuturi răcoritoare și regiune.
Și dacă se întâmplă contrariul, ipoteza alternativă este adevărată: există o relație între consum și regiune.
Este pentru aceste cazuri când testul Mann - Whitney U este indicat.
Eșantioane pereche sau nepereche
Următoarea întrebare importantă pentru a decide dacă se aplică testul Mann Whitney U este dacă numărul de date din ambele probe este identic, ceea ce înseamnă că sunt la egalitate.
Dacă cele două probe sunt împerecheate, se va aplica versiunea originală Wilcoxon. Dar dacă nu, așa cum se întâmplă în exemplu, atunci se aplică testul Wilcoxon modificat, care este exact testul Mann Whitney U.
Caracteristicile testului Mann Whitney U
Testul Mann - Whitney U este un test non-parametric, aplicabil eșantioanelor care nu respectă distribuția normală sau cu puține date. Are următoarele caracteristici:
1.- Comparați medianele
2.- Funcționează pe intervale ordonate
3.- Este mai puțin puternic, adică puterea este probabilitatea de a respinge ipoteza nulă atunci când este de fapt falsă.
Ținând cont de aceste caracteristici, testul Mann - Whitney U se aplică atunci când:
-Datele sunt independente
-Nu respectă distribuția normală
-Ipoteza nulă H0 este acceptată dacă mediile celor două probe coincid: Ma = Mb
-Problema alternativă H1 este acceptată dacă mediile celor două probe diferă: Ma ≠ Mb
Mann - formula Whitney
Variabila U este statistica de contrast utilizată în testul Mann - Whitney și este definită după cum urmează:
Aceasta înseamnă că U este cea mai mică dintre valorile dintre Ua și Ub, aplicate fiecărui grup. În exemplul nostru, ar fi fiecărei regiuni: A sau B.
Variabilele Ua și Ub sunt definite și calculate după următoarea formulă:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Aici valorile Na și Nb sunt mărimile eșantioanelor corespunzătoare regiunilor A și B, iar pentru partea lor, Ra și Rb sunt sumele de rang pe care le vom defini mai jos.
Pași pentru aplicarea testului
1.- Comandați valorile celor două probe.
2.- Alocați un rang de ordine fiecărei valori.
3.- Corectează legăturile existente în date (valori repetate).
4.- Calculați Ra = Suma rândurilor din eșantionul A.
5.- Găsiți Rb = Suma rândurilor din eșantionul B.
6.- Determinați valoarea Ua și Ub, conform formulelor date în secțiunea anterioară.
7.- Comparați Ua și Ub, iar cea mai mică dintre cele două este atribuită statisticii U experimentale (adică a datelor) care este comparată cu statistica U teoretică sau normală.
Exemplu de aplicare practică
Acum aplicăm cele menționate anterior la problema băuturilor răcoritoare ridicate anterior:
Regiunea A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Regiunea B: 12,14, 11, 30, 10
În funcție de faptul că mijloacele ambelor probe sunt statistic identice sau diferite, ipoteza nulă este acceptată sau respinsă: nu există nicio relație între variabilele Y și X, adică consumul de băuturi răcoritoare nu depinde de regiune:
H0: Ma = Mb
H1: Ma ≠ Mb
Figura 2. Date privind consumul de băuturi răcoritoare în regiunile A și B. Sursa: F. Zapata.
- Pasul 1
Procedăm să comandăm datele în comun pentru cele două probe, ordonând valorile de la cea mai mică la cea mai mare:
Observați că valoarea 11 apare de 2 ori (o dată în fiecare eșantion). Inițial are poziții sau intervale 3 și 4, dar pentru a nu supraestima sau subestima una sau alta, valoarea medie este aleasă ca interval, adică 3,5.
Într-un mod similar, procedăm cu valoarea 12, care se repetă de trei ori cu intervalele 5, 6 și 7.
Ei bine, valorii 12 i se atribuie intervalul mediu de 6 = (5 + 6 + 7) / 3. Și la fel pentru valoarea 14, care are ligatura (apare în ambele probe) în pozițiile 8 și 9, i se atribuie intervalul mediu 8,5 = (8 + 9) / 2.
- Pasul 2
În continuare, datele pentru regiunile A și B sunt separate din nou, dar acum intervalele corespunzătoare sunt atribuite într-un alt rând:
Regiunea A
Regiunea B
Intervalele Ra și Rb sunt obținute din sumele elementelor celui de-al doilea rând pentru fiecare caz sau regiune.
Pasul 3
Valorile respective Ua și Ub sunt calculate:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Valoarea experimentală U = min (19, 31) = 19
Pasul 4
Se presupune că U teoretic urmărește o distribuție normală N cu parametri dat exclusiv de mărimea eșantioanelor:
N ((na⋅nb) / 2, √)
Pentru a compara variabila U obținută experimental, cu U teoretică este necesar să se facă o modificare a variabilei. Trecem de la variabila experimentală U la valoarea sa standardizată, care se va numi Z, pentru a putea face comparația cu cea a unei distribuții normale standardizate.
Modificarea variabilei este următoarea:
Z = (U - na.nb / 2) / √
Trebuie menționat că pentru modificarea variabilei s-au folosit parametrii distribuției teoretice pentru U. Atunci noua variabilă Z, care este un hibrid între U teoretic și U experimental, este contrastată cu o distribuție normalizată normalizată N (0,1 ).
Criterii de comparație
Dacă Z ≤ Zα ⇒ ipoteza nulă H0 este acceptată
Dacă Z> Zα ⇒ respinge ipoteza nulă H0
Valorile critice standard Zα depind de nivelul necesar de încredere, de exemplu, pentru un nivel de încredere α = 0,95 = 95%, ceea ce este cel mai obișnuit, se obține valoarea critică Zα = 1,96.
Pentru datele prezentate aici:
Z = (U - na nb / 2) / √ = -0,73
Ceea ce este sub valoarea critică 1.96.
Deci concluzia finală este că ipoteza nulă H0 este acceptată:
Calculatoare online pentru testul Mann - Whitney U
Există programe specifice pentru calcule statistice, inclusiv SPSS și MINITAB, dar aceste programe sunt plătite, iar utilizarea lor nu este întotdeauna ușoară. Acest lucru se datorează faptului că oferă atât de multe opțiuni, încât utilizarea lor este practic rezervată experților în statistici.
Din fericire, există o serie de programe online foarte precise, gratuite și ușor de utilizat, care vă permit să rulați testul Mann-Whitney U, printre altele.
Aceste programe sunt:
-Social Science Statistics (socscistatistics.com), care are atât testul Mann-Whitney U, cât și testul Wilcoxon în cazul probelor echilibrate sau în pereche.
-AI Therapy Statistics (ai-therapy.com), care are câteva dintre testele obișnuite ale statisticilor descriptive.
-Statistic to Use (physics.csbsju.edu/stats), unul dintre cele mai vechi, deci interfața poate părea datată, deși este totuși un program gratuit foarte eficient.
Referințe
- Dietrichson. Metode cantitative: test de rang. Recuperat de la: bookdown.org
- Ghidul Marín J P. SPSS: Analiză și proceduri în teste non-parametrice. Recuperat din: halweb.uc3m.es
- UTILIZARE MOOC Testele nonparametrice: Mann-Whitney U. Recuperat de pe: youtube.com
- Wikipedia. Testul Mann-Whitney U. Recuperat din: es.wikipedia.com
- XLSTAT. Centru de ajutor. Mann - tutorial de test Whitney în Excel. Recuperat de la: help.xlsat.com