Kryteria i metody testowania hipotez statystycznych, przykłady

Spisu treści:

Kryteria i metody testowania hipotez statystycznych, przykłady
Kryteria i metody testowania hipotez statystycznych, przykłady
Anonim

Testowanie hipotez jest niezbędną procedurą w statystyce. Test hipotezy ocenia dwa wzajemnie wykluczające się stwierdzenia, aby określić, które stwierdzenie jest najlepiej poparte danymi z próby. Kiedy mówi się, że wynik jest istotny statystycznie, jest to spowodowane testem hipotezy.

Metody weryfikacji

Metody testowania hipotez statystycznych to metody analizy statystycznej. Zazwyczaj porównuje się dwa zestawy statystyk lub zestaw danych z próby z zestawem danych syntetycznych z wyidealizowanego modelu. Dane należy zinterpretować w taki sposób, aby dodać nowe znaczenia. Możesz je zinterpretować, zakładając określoną strukturę wyniku końcowego i stosując metody statystyczne, aby potwierdzić lub odrzucić założenie. Założenie to nazywa się hipotezą, a testy statystyczne wykorzystywane w tym celu nazywane są hipotezami statystycznymi.

H0 i H1 hipotezy

Istnieją dwa głównekoncepcje statystycznego testowania hipotez – tzw. „hipoteza główna lub zerowa” i „hipoteza alternatywna”. Nazywa się je również hipotezami Neymana-Pearsona. Założenie testu statystycznego nazywa się hipotezą zerową, hipotezą główną lub w skrócie H0. Często nazywa się to założeniem domyślnym lub założeniem, że nic się nie zmieniło. Naruszenie założenia testowego jest często określane jako hipoteza pierwsza, hipoteza alternatywna lub H1. H1 jest skrótem dla jakiejś innej hipotezy, ponieważ wszystko, co o niej wiemy, to to, że dane H0 można odrzucić.

test hipotezy zerowej
test hipotezy zerowej

Przed odrzuceniem lub nieodrzuceniem hipotezy zerowej należy zinterpretować wynik testu. Porównanie jest uważane za statystycznie istotne, jeśli jest mało prawdopodobne, aby związek między zestawami danych był realizacją hipotezy zerowej zgodnie z prawdopodobieństwem progowym - poziomem istotności. Istnieją również kryteria dobroci dopasowania do testowania hipotez statystycznych. Jest to nazwa kryterium testowania hipotezy, które jest związane z domniemanym prawem nieznanego rozkładu. Jest to liczbowa miara rozbieżności między rozkładami empirycznymi i teoretycznymi.

Procedura i kryteria testowania hipotez statystycznych

Najczęstsze metody wyboru hipotez opierają się na kryterium informacyjnym Akaike lub współczynniku Bayesa. Testowanie hipotez statystycznych jest kluczową techniką zarówno we wnioskowaniu, jak i wnioskowaniu bayesowskim, chociaż oba typy mają znaczące różnice. Testy hipotez statystycznychzdefiniować procedurę, która kontroluje prawdopodobieństwo błędnego podjęcia decyzji w sprawie nieprawidłowej hipotezy domyślnej lub zerowej. Procedura opiera się na prawdopodobieństwie jej działania. To prawdopodobieństwo podjęcia błędnej decyzji jest nieprawdopodobieństwem, że hipoteza zerowa jest prawdziwa i że nie istnieje żadna konkretna hipoteza alternatywna. Test nie może wykazać, czy jest to prawda czy fałsz.

Metody testowania hipotez statystycznych
Metody testowania hipotez statystycznych

Alternatywne metody teorii decyzji

Istnieją alternatywne metody teorii decyzji, w których hipotezy zerowa i pierwsza są rozpatrywane na bardziej równych zasadach. Inne podejścia do podejmowania decyzji, takie jak teoria bayesowska, próbują zrównoważyć konsekwencje złych decyzji we wszystkich możliwościach, zamiast skupiać się na pojedynczej hipotezie zerowej. Szereg innych podejść do decydowania, która z hipotez jest poprawna, opiera się na danych, które z nich mają pożądane właściwości. Jednak testowanie hipotez jest dominującym podejściem do analizy danych w wielu dziedzinach nauki.

Testowanie hipotezy statystycznej

Za każdym razem, gdy jeden zestaw wyników różni się od innego zestawu, należy polegać na testowaniu hipotez statystycznych lub testach hipotez statystycznych. Ich interpretacja wymaga odpowiedniego zrozumienia wartości p i wartości krytycznych. Ważne jest również, aby zrozumieć, że niezależnie od poziomu istotności testy mogą nadal zawierać błędy. Dlatego wniosek może nie być prawidłowy.

Proces testowania składa się zwiele kroków:

  1. Powstaje wstępna hipoteza do badań.
  2. Wskazano odpowiednie hipotezy zerowe i alternatywne.
  3. Objaśnia założenia statystyczne dotyczące próbki w teście.
  4. Określanie, który test jest odpowiedni.
  5. Wybierz poziom istotności i próg prawdopodobieństwa, poniżej którego hipoteza zerowa zostanie odrzucona.
  6. Rozkład statystyki testowej hipotezy zerowej pokazuje możliwe wartości, przy których hipoteza zerowa jest odrzucana.
  7. Obliczenia w toku.
  8. Podjęta zostaje decyzja o odrzuceniu lub zaakceptowaniu hipotezy zerowej na rzecz alternatywy.

Istnieje alternatywa, która używa wartości p.

Przykłady testowania hipotez statystycznych
Przykłady testowania hipotez statystycznych

Testy istotności

Czyste dane nie mają praktycznego zastosowania bez interpretacji. W statystyce, jeśli chodzi o zadawanie pytań o dane i interpretację wyników, stosuje się metody statystyczne w celu zapewnienia dokładności lub prawdopodobieństwa odpowiedzi. Podczas testowania hipotez statystycznych ta klasa metod nazywana jest testami statystycznymi lub testami istotności. Termin „hipoteza” przypomina metody naukowe, w których bada się hipotezy i teorie. W statystyce test hipotezy skutkuje wielkością przy danym założeniu. Pozwala zinterpretować, czy założenie jest prawdziwe, czy też doszło do naruszenia.

Interpretacja statystyczna testów

Testowanie hipotezsłużą do określenia, które wyniki badań doprowadzą do odrzucenia hipotezy zerowej dla z góry określonego poziomu istotności. Wyniki testu hipotez statystycznych należy zinterpretować, aby można było nad nim kontynuować prace. Istnieją dwie popularne formy kryteriów testowania hipotez statystycznych. Są to wartości p i wartości krytyczne. W zależności od wybranego kryterium otrzymane wyniki muszą być różnie interpretowane.

Co to jest wartość p

Wyjście jest określane jako statystycznie istotne podczas interpretacji wartości p. W rzeczywistości wskaźnik ten oznacza prawdopodobieństwo błędu w przypadku odrzucenia hipotezy zerowej. Innymi słowy, można go użyć do nazwania wartości, która może być użyta do interpretacji lub ilościowego określenia wyniku testu oraz do określenia prawdopodobieństwa błędu w odrzuceniu hipotezy zerowej. Na przykład możesz przeprowadzić test normalności na próbce danych i stwierdzić, że istnieje niewielka szansa na wystąpienie wartości odstającej. Jednak hipotezy zerowej nie trzeba odrzucać. Test hipotezy statystycznej może zwrócić wartość p. Odbywa się to poprzez porównanie wartości p z wcześniej określoną wartością progową nazywaną poziomem istotności.

Statystyczne testowanie hipotez zerowych
Statystyczne testowanie hipotez zerowych

Poziom istotności

Poziom istotności jest często pisany małą grecką literą „alfa”. Ogólna wartość używana dla alfa to 5%, czyli 0,05. Mniejsza wartość alfa sugeruje bardziej wiarygodną interpretację hipotezy zerowej. Wartość p jest porównywana zwstępnie wybrana wartość alfa. Wynik jest statystycznie istotny, jeśli wartość p jest mniejsza niż alfa. Poziom istotności można odwrócić, odejmując go od jednego. Ma to na celu określenie poziomu ufności hipotezy na podstawie obserwowanych danych próbki. Przy stosowaniu tej metody testowania hipotez statystycznych wartość P jest probabilistyczna. Oznacza to, że w procesie interpretacji wyniku testu statystycznego nie wiadomo, co jest prawdą, a co fałszem.

Teoria testowania hipotez statystycznych

Odrzucenie hipotezy zerowej oznacza, że istnieje wystarczająca ilość dowodów statystycznych, że wydaje się to prawdopodobne. W przeciwnym razie oznacza to, że nie ma wystarczających statystyk, aby go odrzucić. Można myśleć o testach statystycznych w kategoriach dychotomii odrzucania i akceptowania hipotezy zerowej. Niebezpieczeństwo statystycznego testowania hipotezy zerowej polega na tym, że jeśli zostanie zaakceptowana, może wydawać się prawdziwa. Zamiast tego bardziej poprawne byłoby stwierdzenie, że hipoteza zerowa nie jest odrzucana, ponieważ nie ma wystarczających dowodów statystycznych, aby ją odrzucić.

Hipoteza statystyczna testująca kryteria dobroci dopasowania
Hipoteza statystyczna testująca kryteria dobroci dopasowania

Ten moment często myli początkujących statystów. W takim przypadku ważne jest, aby przypomnieć sobie, że wynik jest probabilistyczny i nawet przyjęcie hipotezy zerowej nadal ma niewielką szansę na błąd.

Prawda lub fałszywa hipoteza zerowa

Interpretacja wartości p nie oznacza, że zerohipoteza jest prawdziwa lub fałszywa. Oznacza to, że dokonano wyboru odrzucenia lub nieodrzucenia hipotezy zerowej na pewnym poziomie istotności statystycznej na podstawie danych empirycznych i wybranego testu statystycznego. Dlatego wartość p można traktować jako prawdopodobieństwo danych podanych przy z góry określonym założeniu osadzonym w testach statystycznych. Wartość p jest miarą prawdopodobieństwa zaobserwowania próbki danych, jeśli hipoteza zerowa jest prawdziwa.

Interpretacja wartości krytycznych

Niektóre testy nie zwracają p. Zamiast tego mogą zwrócić listę wartości krytycznych. Podobnie interpretuje się wyniki takiego badania. Zamiast porównywać pojedynczą wartość p z wcześniej określonym poziomem istotności, statystyka testowa jest porównywana z wartością krytyczną. Jeśli okaże się, że jest mniej, oznacza to, że nie udało się odrzucić hipotezy zerowej. Jeśli jest większa lub równa, hipotezę zerową należy odrzucić. Znaczenie algorytmu testującego hipotezy statystyczne i interpretacja jego wyników jest zbliżone do wartości p. Wybrany poziom istotności to probabilistyczna decyzja o odrzuceniu lub nieodrzuceniu podstawowego założenia testu na podstawie danych.

Błędy w testach statystycznych

Interpretacja testu hipotez statystycznych jest probabilistyczna. Zadaniem testowania hipotez statystycznych nie jest znalezienie twierdzenia prawdziwego lub fałszywego. Dowody z badań mogą być błędne. Na przykład, jeśli alfa wynosiła 5%, oznacza to, że w większości 1 z 20hipoteza zerowa zostanie przez pomyłkę odrzucona. Albo nie będzie z powodu szumu statystycznego w próbce danych. Biorąc pod uwagę ten punkt, mała wartość p, przy której należy odrzucić hipotezę zerową, może oznaczać, że jest ona fałszywa lub że popełniono błąd. W przypadku popełnienia tego typu błędu wynik jest nazywany fałszywie pozytywnym. A taki błąd jest błędem pierwszego rodzaju przy testowaniu hipotez statystycznych. Z drugiej strony, jeśli wartość p jest wystarczająco duża, aby oznaczać odrzucenie hipotezy zerowej, może to oznaczać, że jest ona prawdziwa. Lub nie jest poprawny i wystąpiło mało prawdopodobne zdarzenie, w wyniku którego popełniono błąd. Ten typ błędu jest nazywany fałszywie ujemnym.

Statystyczne testowanie hipotez zerowych
Statystyczne testowanie hipotez zerowych

Prawdopodobieństwo błędów

Podczas testowania hipotez statystycznych nadal istnieje ryzyko popełnienia tego typu błędów. Fałszywe dane lub fałszywe wnioski są całkiem prawdopodobne. Najlepiej byłoby wybrać poziom istotności, który minimalizuje prawdopodobieństwo jednego z tych błędów. Na przykład testowanie statystyczne hipotez zerowych może mieć bardzo niski poziom istotności. Chociaż poziomy istotności, takie jak 0,05 i 0,01, są powszechne w wielu dziedzinach nauki, najczęściej stosowanym poziomem istotności jest 310^-7 lub 0,0000003. Często określa się go mianem „5-sigma”. Oznacza to, że wniosek był losowy z prawdopodobieństwem 1 na 3,5 miliona niezależnych powtórzeń eksperymentów. Przykłady testowania hipotez statystycznych często obarczone są takimi błędami. Jest to również powód, dla którego ważne jest, aby uzyskać niezależne wyniki.weryfikacja.

Przykłady wykorzystania weryfikacji statystycznej

Istnieje kilka typowych przykładów testowania hipotez w praktyce. Jeden z najpopularniejszych znany jest jako „Degustacja herbaty”. Dr Muriel Bristol, kolega założyciela biometrii Roberta Fishera, twierdził, że jest w stanie z całą pewnością stwierdzić, czy został dodany najpierw do filiżanki herbaty czy mleka. Fisher zaoferował jej losowo osiem filiżanek (po cztery z każdej odmiany). Statystyka testu była prosta: liczenie sukcesów w wyborze kubka. Region krytyczny był jedynym sukcesem z 4, prawdopodobnie w oparciu o zwykłe kryterium prawdopodobieństwa (< 5%; 1 na 70 ≈ 1,4%). Fisher twierdził, że alternatywna hipoteza nie jest wymagana. Pani poprawnie zidentyfikowała każdą filiżankę, co uznano za wynik istotny statystycznie. To doświadczenie doprowadziło do powstania książki Fishera Metody statystyczne dla badaczy.

Przykład oskarżonego

Procedura procesu statystycznego jest porównywalna do sądu karnego, w którym oskarżony jest uważany za niewinnego do czasu udowodnienia mu winy. Prokurator próbuje udowodnić winę oskarżonego. Tylko wtedy, gdy istnieją wystarczające dowody na oskarżenie, oskarżony może zostać uznany za winnego. Na początku postępowania stawiane są dwie hipotezy: „Oskarżony jest niewinny” oraz „Oskarżony jest winny”. Hipotezę niewinności można odrzucić tylko wtedy, gdy błąd jest bardzo mało prawdopodobny, ponieważ nie chce się skazywać niewinnego oskarżonego. Taki błąd nazywamy błędem I typu, a jego wystąpienierzadko kontrolowane. W konsekwencji tego asymetrycznego zachowania częściej występuje błąd typu II, tj. uniewinnienie sprawcy.

Przykłady walidacji statystycznej
Przykłady walidacji statystycznej

Statystyki są przydatne podczas analizowania dużych ilości danych. Dotyczy to w równym stopniu testowania hipotez, które mogą uzasadniać wnioski, nawet jeśli nie istnieje żadna teoria naukowa. W przykładzie z degustacją herbaty było „oczywiste”, że nie ma różnicy między nalewaniem mleka do herbaty a nalaniem herbaty do mleka.

Prawdziwe praktyczne zastosowanie testowania hipotez obejmuje:

  • badanie, czy mężczyźni mają więcej koszmarów niż kobiety;
  • przypisanie dokumentu;
  • Ocena wpływu pełni księżyca na zachowanie;
  • określenie zasięgu, w którym nietoperz może wykryć owada za pomocą echa;
  • wybór najlepszego sposobu na rzucenie palenia;
  • Sprawdzenie, czy naklejki na zderzaki odzwierciedlają zachowanie właściciela samochodu.

Testowanie hipotez statystycznych odgrywa ważną rolę w ogólnej statystyce oraz we wnioskowaniu statystycznym. Testowanie wartości jest stosowane jako zamiennik tradycyjnego porównywania przewidywanej wartości i wyniku eksperymentalnego, będącego podstawą metody naukowej. Gdy teoria jest w stanie przewidzieć jedynie znak powiązania, ukierunkowane testy hipotez można skonfigurować w taki sposób, aby tylko statystycznie istotny wynik potwierdzał teorię. Ta forma teorii ewaluacji jest najbardziej sztywnakrytyka stosowania testowania hipotez.

Zalecana: