Częstym pytaniem przy porównywaniu dwóch zestawów pomiarów jest to, czy użyć procedury testowania parametrycznego, czy nieparametrycznego. Najczęściej za pomocą symulacji porównuje się kilka testów parametrycznych i nieparametrycznych, takich jak test t, test normalny (testy parametryczne), poziomy Wilcoxona, wyniki van der Waldena itp. (nieparametryczne).
Testy parametryczne zakładają podstawowe rozkłady statystyczne w danych. Dlatego, aby ich wynik był wiarygodny, musi być spełnionych kilka warunków rzeczywistości. Testy nieparametryczne nie zależą od żadnego rozkładu. Dzięki temu można je zastosować nawet wtedy, gdy parametry rzeczywistości nie są spełnione. W tym artykule rozważymy metodę parametryczną, a mianowicie współczynnik korelacji Studenta.
Porównanie parametryczne próbek (t-Student)
Metody są klasyfikowane na podstawie tego, co wiemy o tematach, które analizujemy. Podstawowa idea polega na tym, że istnieje zestaw stałych parametrów, które definiują model probabilistyczny. Wszystkie typy współczynnika Studenta są metodami parametrycznymi.
Są to często te metody, po przeanalizowaniu widzimy, że temat jest w przybliżeniu normalny, więc przed użyciem kryterium należy sprawdzić normalność. Oznacza to, że rozmieszczenie cech w tabeli rozkładu Studenta (w obu próbach) nie powinno znacząco różnić się od normalnego i powinno odpowiadać lub w przybliżeniu zgadzać się z określonym parametrem. W przypadku rozkładu normalnego istnieją dwie miary: średnia i odchylenie standardowe.
Test t Studenta jest stosowany podczas testowania hipotez. Pozwala przetestować założenie mające zastosowanie do badanych. Najczęstszym zastosowaniem tego testu jest sprawdzenie, czy średnie z dwóch próbek są równe, ale można go również zastosować do pojedynczej próbki.
Należy dodać, że zaletą stosowania testu parametrycznego zamiast nieparametrycznego jest to, że ten pierwszy będzie miał większą moc statystyczną niż ten drugi. Innymi słowy, test parametryczny z większym prawdopodobieństwem doprowadzi do odrzucenia hipotezy zerowej.
Pojedyncze próbne testy t-Studenta
Pojedynczy iloraz Studenta to procedura statystyczna używana do określenia, czy próbka obserwacji może być wygenerowana przez proces o specjalnej średniej. Załóżmy, że średnia wartość rozważanej cechy Mхróżni się od pewnej znanej wartości A. Oznacza to, że możemy postawić hipotezę H0 i H1. Za pomocą wzoru t-empirycznego dla jednej próbki możemy sprawdzić, która z przyjętych przez nas hipotez jest prawidłowa.
Wzór na wartość empiryczną testu t-Studenta:
Testy t-Studenta dla prób niezależnych
Niezależny iloraz Studenta to jego użycie, gdy otrzymuje się dwa oddzielne zestawy niezależnych i równomiernie rozłożonych próbek, po jednym z każdego z dwóch porównywanych porównań. Przy niezależnym założeniu zakłada się, że elementy dwóch próbek nie utworzą pary skorelowanych wartości cech. Załóżmy na przykład, że oceniamy efekt leczenia medycznego i włączamy 100 pacjentów do naszego badania, a następnie losowo przypisujemy 50 pacjentów do grupy leczenia i 50 do grupy kontrolnej. W tym przypadku mamy odpowiednio dwie niezależne próbki, możemy sformułować hipotezy statystyczne H0 i H1i przetestować je za pomocą podanych wzorów do nas.
Wzory na wartość empiryczną testu t-Studenta:
Formuła 1 może być użyta do obliczeń przybliżonych, dla próbek o zbliżonej liczbie, a formuła 2 do dokładnych obliczeń, gdy próbki różnią się znacznie liczbą.
Test T-Studenta dla próbek zależnych
Sparowane testy t zwykle składają się z pasujących par tych samych jednostek lubjedna grupa jednostek, która została podwójnie przetestowana (test t „ponownego pomiaru”). Gdy mamy zależne próbki lub dwie serie danych, które są ze sobą dodatnio skorelowane, możemy odpowiednio sformułować hipotezy statystyczne H0 i H1i sprawdź je za pomocą podanego nam wzoru na empiryczną wartość testu t-Studenta.
Na przykład badani są badani przed leczeniem pod kątem wysokiego ciśnienia krwi i ponownie badani po leczeniu lekiem obniżającym ciśnienie krwi. Porównując te same wyniki pacjentów przed i po leczeniu, skutecznie wykorzystujemy każdy z nich jako własną kontrolę.
Tak więc prawidłowe odrzucenie hipotezy zerowej może stać się znacznie bardziej prawdopodobne, ponieważ moc statystyczna wzrasta po prostu dlatego, że losowa zmienność między pacjentami została wyeliminowana. Należy jednak pamiętać, że wzrost mocy statystycznej wynika z oceny: wymaganych jest więcej testów, każdy przedmiot musi być dwukrotnie sprawdzony.
Wniosek
Forma testowania hipotez, iloraz Studenta jest tylko jedną z wielu opcji wykorzystywanych w tym celu. Statystycy powinni dodatkowo stosować metody inne niż test t, aby zbadać więcej zmiennych przy większych liczebnościach próby.