Testul Tukey este o metodă care urmărește compararea mijloacelor individuale dintr-o analiză de varianță a mai multor probe supuse diferitelor tratamente.
Testul, prezentat în 1949 de John.W. Tukey, ne permite să vedem dacă rezultatele obținute sunt semnificativ diferite sau nu. Este, de asemenea, cunoscut ca testul diferenței sincer semnificativ Tukey (testul HSD al lui Tukey).
Figura 1. Testul Tukey ne permite să vedem dacă diferențele de rezultate între trei sau mai multe tratamente diferite aplicate la trei sau mai multe grupuri cu aceleași caracteristici, au valori medii semnificativ și sincer diferite.
În experimentele în care sunt comparate trei sau mai multe tratamente diferite la același număr de eșantioane, este necesar să se discerne dacă rezultatele sunt semnificativ diferite sau nu.
Se spune că un experiment este echilibrat atunci când mărimea tuturor eșantioanelor statistice este aceeași pentru fiecare tratament. Atunci când dimensiunea eșantioanelor este diferită pentru fiecare tratament, atunci se face un experiment dezechilibrat.
Uneori, nu este suficientă o analiză a varianței (ANOVA) pentru a ști dacă în comparația diferitelor tratamente (sau experimente) aplicate mai multor probe îndeplinesc ipoteza nulă (Ho: „toate tratamentele sunt egale”) sau, dimpotrivă, îndeplinește ipoteza alternativă (Ha: „cel puțin unul dintre tratamente este diferit”).
Testul Tukey nu este unic, există multe alte teste pentru a compara mijloacele de probă, dar acesta este unul dintre cele mai cunoscute și aplicate.
Comparator și tabel de tukey
În aplicarea acestui test se calculează o valoare w numită comparator Tukey a cărei definiție este următoarea:
w = q √ (MSE / r)
În cazul în care factorul q este obținut dintr-un tabel (Tukey's Table), care constă din rânduri de valori q pentru un număr diferit de tratamente sau experimente. Coloanele indică valoarea factorului q pentru diferite grade de libertate. De obicei, tabelele disponibile au o semnificație relativă de 0,05 și 0,01.
În această formulă, în rădăcina pătrată apare factorul MSE (pătratul mediu al erorii) împărțit la r, care indică numărul de repetări. MSE este un număr care este obținut în mod normal dintr-o analiză a varianțelor (ANOVA).
Când diferența dintre două valori medii depășește valoarea w (comparator Tukey), atunci se concluzionează că sunt medii diferite, dar dacă diferența este mai mică decât numărul Tukey, atunci este vorba de două probe cu valoarea medie identică statistic. .
Numărul w este cunoscut și sub denumirea de HSD (Honestly Significant Difference).
Acest număr comparativ unic poate fi aplicat dacă numărul de eșantioane solicitate pentru testul fiecărui tratament este același în fiecare dintre ele.
Experimente dezechilibrate
Când, din anumite motive, dimensiunea eșantioanelor este diferită în fiecare tratament care trebuie comparat, atunci procedura descrisă mai sus diferă ușor și este cunoscută sub numele de testul Tukey-Kramer.
Acum se obține un număr de comparativ w pentru fiecare pereche de tratamente i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
În această formulă, factorul q este obținut din tabelul lui Tukey. Acest factor q depinde de numărul de tratamente și de gradele de libertate a erorii. r i este numărul de repetări în tratamentul i, în timp ce r j este numărul de repetări în tratamentul j.
Exemplu de caz
Un crescător de iepuri dorește să facă un studiu statistic fiabil care să îi spună care dintre cele patru mărci ale alimentelor care îngrășă iepurele este cea mai eficientă. Pentru studiu, el a format patru grupuri cu șase iepuri de o lună și jumătate care până atunci aveau aceleași condiții de hrănire.
Motivele au fost că în grupele A1 și A4, decesele s-au produs din cauze care nu sunt atribuibile alimentelor, deoarece unul dintre iepuri a fost mușcat de o insectă, iar în celălalt caz, moartea a fost probabil cauza unui defect congenital. Deci, grupurile sunt dezechilibrate și atunci este necesar să se aplice testul Tukey-Kramer.
Exercițiu rezolvat
Pentru a nu prelungi prea mult calculele, se va lua un caz de experiment echilibrat ca un exercițiu rezolvat. Următoarele date vor fi luate ca date:
În acest caz, există patru grupe corespunzătoare a patru tratamente diferite. Cu toate acestea, observăm că toate grupurile au același număr de date, deci este un caz echilibrat.
Pentru a efectua analiza ANOVA, a fost folosit instrumentul încorporat în foaia de calcul Libreoffice. Alte foi de calcul, cum ar fi Excel, au inclus acest instrument pentru analiza datelor. Mai jos este prezentat un tabel sumar care a rezultat după analiza varianței (ANOVA):
Din analiza varianței, avem și valoarea P, care de exemplu este 2.24E-6, cu mult sub nivelul de semnificație de 0,05, ceea ce duce direct la respingerea ipotezei nule: Toate tratamentele sunt egale.
Adică, printre tratamente, unii au valori medii diferite, dar este necesar să știm care sunt diferit statistic semnificativ și sincer (HSD) folosind testul Tukey.
Pentru a găsi numărul wo, după cum este cunoscut și numărul HSD, trebuie să găsim pătratul mediu al erorii MSE. Din analiza ANOVA se obține că suma pătratelor din grupele este SS = 0,2; iar numărul de grade de libertate în cadrul grupurilor este df = 16 cu aceste date putem găsi MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
De asemenea, este necesar să găsiți factorul q al Tukey, folosind tabelul. Coloana 4, care corespunde celor 4 grupuri sau tratamente care trebuie comparate, iar rândul 16 sunt căutate, deoarece analiza ANOVA a dat 16 grade de libertate în cadrul grupurilor. Aceasta ne conduce la o valoare de q egală cu: q = 4,33 care corespunde la 0,05 de semnificație sau 95% de fiabilitate. În sfârșit, valoarea „diferenței sincer semnificative” se găsește:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Pentru a ști care sunt grupurile sau tratamentele onest diferite, trebuie să cunoașteți valorile medii ale fiecărui tratament:
De asemenea, este necesar să cunoaștem diferențele dintre valorile medii ale perechilor de tratamente, care este prezentat în următorul tabel:
Se concluzionează că cele mai bune tratamente, în ceea ce privește maximizarea rezultatului, sunt T1 sau T3, care sunt indiferent din punct de vedere statistic. Pentru a alege între T1 și T3, ar trebui să căutăm alți factori în afara analizei prezentate aici. De exemplu, preț, disponibilitate etc.
Referințe
- Cochran William și Cox Gertrude. 1974. Proiecte experimentale. Treierat. Mexic. A treia reeditare. 661p.
- Snedecor, GW și Cochran, WG 1980. Metode statistice. A șaptea ediție Iowa, presa universității de stat din Iowa. 507p.
- Oțel, RGD și Torrie, JH 1980. Principii și proceduri ale statisticilor: o abordare biometrică (ediția a II-a). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Compararea mijloacelor individuale în analiza varianței. Biometrie, 5: 99-114.
- Wikipedia. Testul lui Tukey. Recuperat din: en.wikipedia.com