Rozkład Pearsona: definicja, zastosowanie

Spisu treści:

Rozkład Pearsona: definicja, zastosowanie
Rozkład Pearsona: definicja, zastosowanie
Anonim

Jakie jest prawo dystrybucji Pearsona? Odpowiedź na to szerokie pytanie nie może być prosta i zwięzła. System Pearsona został pierwotnie zaprojektowany do modelowania widocznych zniekształconych obserwacji. W tamtym czasie dobrze wiadomo było, jak dostroić model teoretyczny, aby pasował do dwóch pierwszych kumulantów lub momentów obserwowanych danych: każdy rozkład prawdopodobieństwa można bezpośrednio rozszerzyć, tworząc grupę skal lokalizacji.

Hipoteza Pearsona o normalnym rozkładzie kryteriów

Z wyjątkiem przypadków patologicznych, skala lokalizacji może być dopasowana do obserwowanej średniej (pierwsza kumulacja) i wariancji (druga kumulacja) w arbitralny sposób. Nie było jednak wiadomo, jak skonstruować rozkłady prawdopodobieństwa, w których skośność (standaryzowana trzecia kumulanta) i kurtoza (standaryzowana czwarta kumulanta) mogą być kontrolowane w równym stopniu. Ta potrzeba stała się oczywista przy próbie dopasowania znanych modeli teoretycznych do obserwowanych danych,który wykazał asymetrię.

Na poniższym filmie można zobaczyć analizę rozkładu chi Pearsona.

Image
Image

Historia

W swojej oryginalnej pracy Pearson zidentyfikował cztery typy rozkładów (o numerach od I do IV) oprócz rozkładu normalnego (który pierwotnie był znany jako typ V). Klasyfikacja zależy od tego, czy rozkłady są obsługiwane w ograniczonym przedziale, na półosi, czy na całej linii rzeczywistej oraz czy były potencjalnie skośne, czy koniecznie symetryczne.

Dwa pominięcia zostały skorygowane w drugim artykule: przedefiniował rozkład typu V (pierwotnie był to tylko rozkład normalny, ale teraz z odwrotną wartością gamma) i wprowadził rozkład typu VI. Pierwsze dwa artykuły łącznie obejmują pięć głównych typów systemu Pearsona (I, III, IV, V i VI). W trzecim artykule Pearson (1916) wprowadził dodatkowe podtypy.

Funkcje rozkładu Pearsona
Funkcje rozkładu Pearsona

Popraw koncepcję

Rind wymyślił prosty sposób wizualizacji przestrzeni parametrów systemu Pearsona (lub rozkładu kryteriów), który później przyjął. Obecnie wielu matematyków i statystyków stosuje tę metodę. Rodzaje rozkładów Pearsona charakteryzują dwie wielkości, zwykle nazywane β1 i β2. Pierwszy to kwadrat asymetrii. Drugi to tradycyjna kurtoza, czyli czwarty znormalizowany moment: β2=γ2 + 3.

Współczesne metody matematyczne definiują kurtozę γ2 jako kumulanty zamiast momentów, czyli dla normalnegomamy rozkład γ2=0 i β2=3. W tym miejscu warto skorzystać z historycznego precedensu i użyć β2. Diagram po prawej pokazuje, jakiego typu jest dany rozkład Pearsona (oznaczony kropką (β1, β2).

Statystyki Pearsona
Statystyki Pearsona

Wiele rozkładów skośnych i/lub niemezokurtycznych, które znamy dzisiaj, nie było jeszcze znanych na początku lat 90. XIX wieku. To, co jest obecnie znane jako rozkład beta, zostało użyte przez Thomasa Bayesa jako parametr a posteriori rozkładu Bernoulliego w jego pracy z 1763 r. na temat prawdopodobieństwa odwrotnego.

Dystrybucja beta zyskała na znaczeniu ze względu na jej obecność w systemie Pearsona i była znana do lat 40. XX wieku jako dystrybucja Pearsona typu I. Rozkład typu II jest szczególnym przypadkiem typu I, ale zwykle nie jest już wyróżniany.

Rozkład Gamma wywodzi się z jego własnej pracy i był znany jako rozkład normalny Pearsona typu III, zanim zyskał swoją współczesną nazwę w latach 30. i 40. XX wieku. W pracy naukowca z 1895 r. przedstawiono rozkład typu IV, który zawiera rozkład t Studenta, jako szczególny przypadek, poprzedzający późniejsze użycie Williama Seely'ego Gosseta o kilka lat. Jego artykuł z 1901 r. przedstawił rozkład z odwrotnymi wartościami gamma (typ V) i beta (typ VI).

Inna opinia

Według Orda, Pearson opracował podstawową postać równania (1) opartą na wzorze na pochodną logarytmu funkcji gęstości rozkładu normalnego (co daje podział liniowy przez kwadratStruktura). W testowanie hipotezy o rozkładzie kryteriów Pearsona nadal zaangażowanych jest wielu specjalistów. I to potwierdza jego skuteczność.

Alternatywna dystrybucja Pearsona
Alternatywna dystrybucja Pearsona

Kim był Karl Pearson

Karl Pearson był angielskim matematykiem i biostatystykiem. Przypisuje mu się stworzenie dyscypliny statystyki matematycznej. W 1911 założył pierwszy na świecie wydział statystyki w University College London i wniósł znaczący wkład w dziedzinie biometrii i meteorologii. Pearson był także zwolennikiem darwinizmu społecznego i eugeniki. Był protegowanym i biografem Sir Francisa G altona.

Biometria

Karl Pearson odegrał kluczową rolę w stworzeniu szkoły biometrii, która była konkurencyjną teorią opisującą ewolucję i dziedziczenie populacji na przełomie XIX i XX wieku. Jego seria osiemnastu artykułów „Wkłady matematyczne do teorii ewolucji” ustanowiła go założycielem biometrycznej szkoły dziedziczenia. W rzeczywistości Pearson poświęcił większość swojego czasu w latach 1893-1904 na: opracowanie metod statystycznych dla biometrii. Metody te, które są obecnie powszechnie stosowane do analizy statystycznej, obejmują test chi-kwadrat, odchylenie standardowe, współczynniki korelacji i regresji.

Współczynnik korelacji Pearsona
Współczynnik korelacji Pearsona

Kwestia dziedziczenia

Prawo dziedziczności Pearsona stwierdzało, że plazma zarodkowa składa się z elementów odziedziczonych po rodzicach, a także od dalszych przodków, których proporcja różniła się w zależności od różnych cech. Karl Pearson był zwolennikiem G altona i choć ichprace różniły się pod pewnymi względami, Pearson wykorzystał znaczną ilość pojęć statystycznych swojego nauczyciela przy formułowaniu szkoły biometrycznej do dziedziczenia, takiej jak prawo regresji.

Dystrybucja Pearsona
Dystrybucja Pearsona

Funkcje szkoły

Szkoła biometryczna, w przeciwieństwie do Mendlowców, nie była skoncentrowana na zapewnieniu mechanizmu dziedziczenia, ale na zapewnieniu opisu matematycznego, który nie miał charakteru przyczynowego. Podczas gdy G alton zaproponował nieciągłą teorię ewolucji, w której gatunki zmieniałyby się raczej dużymi skokami niż małymi zmianami, które kumulowały się w czasie, Pearson wskazał na wady tego argumentu i faktycznie wykorzystał swoje pomysły do opracowania ciągłej teorii ewolucji. Mendlowie preferowali nieciągłą teorię ewolucji.

Podczas gdy G alton skupiał się głównie na zastosowaniu metod statystycznych do badania dziedziczności, Pearson i jego kolega Weldon rozszerzyli swoje rozumowanie w tej dziedzinie, zmienności, korelacji doboru naturalnego i płciowego.

Typowa dystrybucja
Typowa dystrybucja

Spojrzenie na ewolucję

Dla Pearsona teoria ewolucji nie miała na celu zidentyfikowania mechanizmu biologicznego wyjaśniającego wzorce dziedziczenia, podczas gdy podejście Mendla twierdziło, że gen jest mechanizmem dziedziczenia.

Pearson skrytykował Batesona i innych biologów za nieprzyjęcie metod biometrycznych w swoich badaniach nad ewolucją. Potępił naukowców, którzy nie skupiali się natrafność statystyczna ich teorii, stwierdzając:

"Zanim będziemy mogli zaakceptować [jakiekolwiek przyczynę postępującej zmiany] jako czynnik, musimy nie tylko pokazać jej wiarygodność, ale, jeśli to możliwe, zademonstrować jej zdolność ilościową."

Biolodzy ulegli „prawie metafizycznym spekulacjom na temat przyczyn dziedziczności”, które zastąpiły proces zbierania danych eksperymentalnych, co może w rzeczywistości pozwolić naukowcom zawęzić potencjalne teorie.

most statystyczny
most statystyczny

Prawa natury

Dla Pearsona prawa natury były przydatne do tworzenia dokładnych prognoz i podsumowywania trendów w obserwowanych danych. Powodem było doświadczenie „że pewna sekwencja wydarzyła się i powtórzyła w przeszłości”.

Tak więc identyfikacja konkretnego mechanizmu genetyki nie była dla biologów wartościowym przedsięwzięciem, powinni oni zamiast tego skoncentrować się na matematycznych opisach danych empirycznych. To częściowo doprowadziło do ostrego sporu między biometrystami a Mendlowianami, w tym Batesonem.

Po tym, jak ten ostatni odrzucił jeden z rękopisów Pearsona, opisujący nową teorię zmienności lub homotypii potomstwa, Pearson i Weldon założyli firmę Biometrika w 1902 roku. Chociaż biometryczne podejście do dziedziczenia w końcu straciło swoją mendlowską perspektywę, opracowane przez nie metody mają kluczowe znaczenie dla dzisiejszej biologii i ewolucji.

Zalecana: