Testarea ipotezelor este unul dintre subiectele principale din zona statisticii inferenţiale. Există mai mulți pași în efectuarea unui test de ipoteză, iar mulți dintre aceștia necesită calcule statistice. Software-ul statistic, cum ar fi Excel, poate fi utilizat pentru a efectua teste de ipoteză. Vom vedea cum funcția Excel Z-TEST testează ipoteze despre o medie necunoscută a populației.
Condiții și ipoteze
Începem prin a stabili ipotezele și condițiile pentru acest tip de testare a ipotezelor. Pentru inferența despre medie trebuie să avem următoarele condiții simple:
- Eșantionul este un eșantion simplu aleatoriu .
- Eșantionul este de dimensiuni reduse în raport cu populația . De obicei, aceasta înseamnă că dimensiunea populației este de peste 20 de ori dimensiunea eșantionului.
- Variabila studiată are o distribuție normală.
- Deviația standard a populației este cunoscută.
- Media populației este necunoscută.
Este puțin probabil ca toate aceste condiții să fie îndeplinite în practică. Cu toate acestea, aceste condiții simple și testul de ipoteză corespunzător se găsesc uneori la începutul unei clase de statistică. După învățarea procesului unui test de ipoteză, aceste condiții sunt relaxate pentru a funcționa într-un mediu mai realist.
Structura testului de ipoteză
Testul de ipoteză particular pe care îl considerăm are următoarea formă:
- Prezentați ipotezele nule și alternative .
- Calculați statistica testului, care este un scor z .
- Calculați valoarea p folosind distribuția normală. În acest caz, valoarea p este probabilitatea de a obține o valoare cel puțin la fel de extremă ca statistica de test observată, presupunând că ipoteza nulă este adevărată.
- Comparați valoarea p cu nivelul de semnificație pentru a determina dacă se respinge sau nu ipoteza nulă.
Vedem că pașii doi și trei sunt intensivi din punct de vedere computațional în comparație cu pașii unu și patru. Funcția Z.TEST va efectua aceste calcule pentru noi.
Funcția Z TEST
Funcția Z.TEST face toate calculele din pașii doi și trei de mai sus. Efectuează majoritatea calculelor numerice pentru testul nostru și returnează o valoare p. Există trei argumente pentru a intra în funcție, fiecare dintre acestea fiind separat prin virgulă. Cele trei tipuri de argumente pentru această funcție sunt explicate mai jos.
- Primul argument al acestei funcții este o matrice de date eșantion. Trebuie să introducem un interval de celule care să corespundă locației datelor eșantionului în foaia noastră de calcul.
- Al doilea argument este valoarea lui μ pe care o testăm în ipotezele noastre. Deci, dacă ipoteza noastră nulă este H 0 : μ = 5, atunci am introduce un 5 pentru al doilea argument.
- Al treilea argument este valoarea deviației standard cunoscute a populației. Excel tratează acest lucru ca pe un argument opțional
Note și avertismente
Există câteva lucruri de reținut despre această caracteristică:
- Valoarea p obținută din funcție este unilaterală. Dacă facem un test cu două fețe, atunci această valoare ar trebui dublată.
- Ieșirea unilaterală a valorii p a funcției presupune că media eșantionului este mai mare decât valoarea lui μ cu care testăm. Dacă media eșantionului este mai mică decât valoarea celui de-al doilea argument, atunci trebuie să scădem rezultatul funcției de la 1 pentru a obține adevărata valoare p a testului nostru.
- Argumentul final pentru deviația standard a populației este opțional. Dacă nu este introdusă, această valoare este înlocuită automat în calculele Excel cu abaterea standard a eșantionului. Când se face acest lucru, teoretic ar trebui folosit un test t.
Exemplu
Presupunem că următoarele date provin dintr-un eșantion aleatoriu simplu dintr-o populație distribuită normal cu medie necunoscută și abatere standard de 3:
1, 2, 3, 3, 4, 4, 8, 10, 12
La nivelul de semnificație de 10%, dorim să testăm ipoteza că datele eșantionului sunt dintr-o populație cu o medie mai mare de 5. Mai formal, avem următoarele ipoteze:
- H0 : μ= 5
- Ha : μ > 5
Folosim Z.TEST în Excel pentru a găsi valoarea p pentru acest test de ipoteză.
- Introduceți datele într-o coloană în Excel. Să presupunem că aceasta este de la celula A1 la A9
- Într-o altă celulă introduceți =Z.TEST(A1:A9,5,3)
- Rezultatul este 0,41207.
- Deoarece valoarea noastră p depășește 10%, nu putem respinge ipoteza nulă.
Funcția Z.TEST poate fi utilizată atât pentru teste cu coadă inferioară, cât și pentru teste cu două cozi. Cu toate acestea, rezultatul nu este la fel de automat ca în acest caz. Vezi aici alte exemple de utilizare a acestei funcții.