Aby znaleźć rozkłady zmiennych losowych i ich zmiennych, konieczne jest zbadanie wszystkich cech tej dziedziny wiedzy. Istnieje kilka różnych metod znajdowania danych wartości, w tym zmiana zmiennej i generowanie momentu. Dystrybucja to koncepcja oparta na takich elementach jak rozproszenie, wariacje. Charakteryzują one jednak tylko stopień amplitudy rozpraszania.
Ważniejszymi funkcjami zmiennych losowych są te, które są powiązane, niezależne i równomiernie rozłożone. Na przykład, jeśli X1 to waga losowo wybranej osoby z populacji męskiej, X2 to waga innej osoby, …, a Xn to waga jeszcze jednej osoby z populacji męskiej, to musimy wiedzieć, jak funkcja losowa X jest rozpowszechniany. W tym przypadku obowiązuje klasyczne twierdzenie zwane centralnym twierdzeniem granicznym. Pozwala pokazać, że dla dużego n funkcja jest zgodna ze standardowymi dystrybucjami.
Funkcje jednej zmiennej losowej
Centralne twierdzenie graniczne służy do przybliżania rozważanych wartości dyskretnych, takich jak dwumian i Poissona. Rozważane są funkcje dystrybucyjne zmiennych losowych przede wszystkim na prostych wartościach jednej zmiennej. Na przykład, jeśli X jest ciągłą zmienną losową mającą własny rozkład prawdopodobieństwa. W tym przypadku zbadamy, jak znaleźć funkcję gęstości Y przy użyciu dwóch różnych podejść, a mianowicie metody funkcji dystrybucji i zmiany zmiennej. Po pierwsze, brane są pod uwagę tylko wartości jeden do jednego. Następnie musisz zmodyfikować technikę zmiany zmiennej, aby znaleźć jej prawdopodobieństwo. Na koniec musimy dowiedzieć się, w jaki sposób funkcja odwrotnego skumulowanego rozkładu może pomóc w modelowaniu liczb losowych zgodnych z pewnymi wzorcami sekwencyjnymi.
Metoda rozkładu rozważanych wartości
Metoda funkcji rozkładu prawdopodobieństwa zmiennej losowej ma zastosowanie w celu znalezienia jej gęstości. Podczas korzystania z tej metody obliczana jest wartość skumulowana. Następnie, różnicując go, możesz uzyskać gęstość prawdopodobieństwa. Teraz, gdy mamy już metodę funkcji dystrybucji, możemy przyjrzeć się jeszcze kilku przykładom. Niech X będzie ciągłą zmienną losową o określonej gęstości prawdopodobieństwa.
Jaka jest funkcja gęstości prawdopodobieństwa x2? Jeśli spojrzysz na lub wykreślisz funkcję (u góry i po prawej) y \u003d x2, możesz zauważyć, że jest to rosnący X i 0 <y<1. Teraz musisz użyć rozważanej metody, aby znaleźć Y. Po pierwsze, funkcja skumulowanego rozkładu została znaleziona, wystarczy zróżnicować, aby uzyskać gęstość prawdopodobieństwa. W ten sposób otrzymujemy: 0<y<1. Metoda dystrybucji została pomyślnie zaimplementowana, aby znaleźć Y, gdy Y jest rosnącą funkcją X. Nawiasem mówiąc, f(y) integruje się w 1 przez y.
W ostatnim przykładzie bardzo starannie zindeksowano funkcje skumulowane i gęstość prawdopodobieństwa za pomocą X lub Y, aby wskazać, do której zmiennej losowej należą. Na przykład, gdy znajdujemy funkcję rozkładu skumulowanego Y, otrzymaliśmy X. Jeśli chcesz znaleźć zmienną losową X i jej gęstość, wystarczy ją zróżnicować.
Technika zmiany zmiennej
Niech X będzie ciągłą zmienną losową podaną przez funkcję dystrybucji o wspólnym mianowniku f (x). W tym przypadku, jeśli umieścisz wartość y w X=v (Y), otrzymasz wartość x, na przykład v (y). Teraz musimy otrzymać dystrybuantę ciągłej zmiennej losowej Y. Gdzie pierwsza i druga równość ma miejsce z definicji skumulowanej Y. Trzecia równość obowiązuje, ponieważ część funkcji, dla której u (X) ≦ y jest prawdą jest również, że X ≦ v (Y). I ostatnia jest wykonywana w celu określenia prawdopodobieństwa w ciągłej zmiennej losowej X. Teraz musimy wziąć pochodną FY (y), dystrybuanty funkcji skumulowanej Y, aby uzyskać gęstość prawdopodobieństwa Y.
Uogólnienie funkcji zmniejszania
Niech X będzie ciągłą zmienną losową ze wspólnym f (x) określonym przez c1<x<c2. I niech Y=u (X) będzie malejącą funkcją X z odwrotnością X=v (Y). Ponieważ funkcja jest ciągła i malejąca, istnieje funkcja odwrotna X=v (Y).
Aby rozwiązać ten problem, możesz zbierać dane ilościowe i korzystać z funkcji empirycznego rozkładu skumulowanego. Mając te informacje i odwołując się do nich, musisz połączyć próbki średnie, odchylenia standardowe, dane medialne i tak dalej.
Podobnie, nawet dość prosty model probabilistyczny może mieć ogromną liczbę wyników. Na przykład, jeśli rzucisz monetą 332 razy. Wtedy liczba wyników uzyskanych z przewrotów jest większa niż w google (10100) - liczba, ale nie mniej niż 100 trylionów razy większa niż cząstki elementarne w znanym wszechświecie. Nie interesuje mnie analiza, która daje odpowiedź na każdy możliwy wynik. Potrzebna byłaby prostsza koncepcja, taka jak liczba głów lub najdłuższy skok ogonów. Aby skoncentrować się na interesujących kwestiach, akceptowany jest określony wynik. Definicja w tym przypadku jest następująca: zmienna losowa jest funkcją rzeczywistą z przestrzenią prawdopodobieństwa.
Zakres S zmiennej losowej jest czasami nazywany przestrzenią stanów. Tak więc, jeśli X jest wartością, o której mowa, to N=X2, exp ↵X, X2 + 1, tan2 X, bXc i tak dalej. Ostatnia z tych funkcji, zaokrąglająca X do najbliższej liczby całkowitej, nazywana jest funkcją floor.
Funkcje dystrybucji
Po określeniu interesującej nas funkcji dystrybucji dla zmiennej losowej x, pytanie zwykle brzmi: "Jakie są szanse, że X wpadnie do jakiegoś podzbioru wartości B?". Na przykład B={liczby nieparzyste}, B={większe niż 1} lub B={między 2 a 7}, aby wskazać te wyniki, które mają X, wartośćzmienna losowa w podzbiorze A. Zatem w powyższym przykładzie można opisać zdarzenia w następujący sposób.
{X jest liczbą nieparzystą}, {X jest większe niż 1}={X> 1}, {X jest między 2 a 7}={2 <X <7}, aby dopasować trzy powyższe opcje dla podzbioru B. Wiele właściwości wielkości losowych nie jest związanych z konkretnym X. Zależą one raczej od tego, jak X przydziela swoje wartości. Prowadzi to do definicji, która brzmi tak: funkcja dystrybucji zmiennej losowej x ma charakter kumulacyjny i jest określana przez obserwacje ilościowe.
Zmienne losowe i funkcje dystrybucji
W ten sposób można obliczyć prawdopodobieństwo, że funkcja rozkładu zmiennej losowej x przyjmie wartości w przedziale przez odjęcie. Pomyśl o włączeniu lub wykluczeniu punktów końcowych.
Nazwiemy zmienną losową dyskretną, jeśli ma ona skończoną lub przeliczalnie nieskończoną przestrzeń stanów. Tak więc X to liczba orłów w trzech niezależnych rzutach obciążonej monetą, która rośnie z prawdopodobieństwem p. Musimy znaleźć funkcję dystrybucji skumulowanej dyskretnej zmiennej losowej FX dla X. Niech X będzie liczbą pików w zbiorze trzech kart. Wtedy Y=X3 przez FX. FX zaczyna się od 0, kończy na 1 i nie maleje wraz ze wzrostem wartości x. Funkcja skumulowanego rozkładu FX dyskretnej zmiennej losowej X jest stała, z wyjątkiem skoków. Podczas przeskakiwania FX jest ciągły. Udowodnij stwierdzenie o poprawnymciągłość funkcji rozkładu z własności prawdopodobieństwa jest możliwa dzięki definicji. Brzmi to tak: stała zmienna losowa ma skumulowany efekt, który jest różniczkowalny.
Aby pokazać, jak to się może stać, możemy podać przykład: cel o promieniu jednostki. Prawdopodobnie. zaszewka jest równomiernie rozłożona na określonym obszarze. Dla niektórych λ> 0. W ten sposób rozkład funkcji ciągłych zmiennych losowych rośnie płynnie. FX ma właściwości funkcji dystrybucji.
Mężczyzna czeka na przystanku, aż przyjedzie autobus. Decydując dla siebie, że odmówi, gdy oczekiwanie osiągnie 20 minut. Tutaj konieczne jest znalezienie funkcji rozkładu skumulowanego dla T. Czas, w którym osoba nadal będzie na dworcu autobusowym lub nie wyjdzie. Pomimo tego, że dla każdej zmiennej losowej zdefiniowana jest skumulowana funkcja dystrybucji. Mimo to dość często będą używane inne charakterystyki: masa dla zmiennej dyskretnej i rozkład gęstości zmiennej losowej. Zwykle wartość jest wyprowadzana przez jedną z tych dwóch wartości.
Funkcje masowe
Te wartości są uwzględniane przez następujące właściwości, które mają charakter ogólny (masowy). Pierwsza opiera się na fakcie, że prawdopodobieństwa nie są ujemne. Drugie wynika z obserwacji, że zbiór dla wszystkich x=2S, przestrzeń stanów dla X, tworzy podział probabilistycznej swobody X. Przykład: rzut monetą obciążoną, którego wyniki są niezależne. Możesz dalej robićpewne działania, dopóki nie otrzymasz rzutu głów. Niech X oznacza zmienną losową, która podaje liczbę ogonów przed pierwszą głową. A p oznacza prawdopodobieństwo w dowolnym działaniu.
Więc funkcja prawdopodobieństwa masy ma następujące cechy charakterystyczne. Ponieważ terminy tworzą ciąg liczbowy, X nazywamy geometryczną zmienną losową. Schemat geometryczny c, cr, cr2,.,,, crn ma sumę. A zatem sn ma limit jako n 1. W tym przypadku limitem jest nieskończona suma.
Powyższa funkcja masy tworzy sekwencję geometryczną ze stosunkiem. Dlatego liczby naturalne a i b. Różnica wartości w funkcji rozkładu jest równa wartości funkcji masy.
Rozważane wartości gęstości mają definicję: X jest zmienną losową, której rozkład FX ma pochodną. FX spełniający Z xFX (x)=fX (t) dt-1 nazywa się funkcją gęstości prawdopodobieństwa. A X nazywamy ciągłą zmienną losową. W podstawowym twierdzeniu rachunku różniczkowego funkcja gęstości jest pochodną rozkładu. Prawdopodobieństwa można obliczyć, obliczając całki oznaczone.
Ponieważ dane są zbierane z wielu obserwacji, do modelowania procedur eksperymentalnych należy brać pod uwagę więcej niż jedną zmienną losową na raz. Zatem zbiór tych wartości i ich łączny rozkład dla dwóch zmiennych X1 i X2 oznacza oglądanie zdarzeń. Dla dyskretnych zmiennych losowych definiuje się wspólne probabilistyczne funkcje masy. Dla ciągłych brane są pod uwagę fX1, X2, gdziełączna gęstość prawdopodobieństwa jest spełniona.
Niezależne zmienne losowe
Dwie zmienne losowe X1 i X2 są niezależne, jeśli dowolne dwa zdarzenia z nimi związane są takie same. Słowem, prawdopodobieństwo, że dwa zdarzenia {X1 2 B1} i {X2 2 B2} wystąpią w tym samym czasie, y, jest równe iloczynowi powyższych zmiennych, że każde z nich występuje indywidualnie. Dla niezależnych dyskretnych zmiennych losowych istnieje łączna probabilistyczna funkcja masy, która jest iloczynem objętości granicznej jonu. Dla ciągłych zmiennych losowych, które są niezależne, łączna funkcja gęstości prawdopodobieństwa jest iloczynem wartości krańcowych gęstości. Na koniec rozważamy n niezależnych obserwacji x1, x2,.,,, xn wynikające z nieznanej funkcji gęstości lub masy f. Na przykład nieznany parametr w funkcjach dla wykładniczej zmiennej losowej opisującej czas oczekiwania na autobus.
Imitacja zmiennych losowych
Głównym celem tej teoretycznej dziedziny jest dostarczenie narzędzi potrzebnych do opracowania procedur wnioskowania opartych na solidnych zasadach nauki statystycznej. Tak więc jednym bardzo ważnym przypadkiem użycia oprogramowania jest możliwość generowania pseudodanych w celu naśladowania rzeczywistych informacji. Umożliwia to testowanie i ulepszanie metod analizy przed koniecznością ich użycia w rzeczywistych bazach danych. Jest to wymagane w celu zbadania właściwości danych poprzezmodelowanie. W przypadku wielu powszechnie używanych rodzin zmiennych losowych, R udostępnia polecenia do ich generowania. W innych okolicznościach potrzebne będą metody modelowania sekwencji niezależnych zmiennych losowych, które mają wspólny rozkład.
Dyskretne zmienne losowe i wzorzec poleceń. Polecenie sample służy do tworzenia prostych i warstwowych próbek losowych. W rezultacie, jeśli wprowadzono sekwencję x, sample(x, 40) wybiera 40 rekordów z x tak, że wszystkie wybory o rozmiarze 40 mają to samo prawdopodobieństwo. Używa domyślnego polecenia R do pobierania bez zastępowania. Może być również używany do modelowania dyskretnych zmiennych losowych. Aby to zrobić, musisz podać przestrzeń stanów w wektorze x oraz funkcję masy f. Wywołanie replace=TRUE wskazuje, że próbkowanie następuje wraz z zamianą. Następnie, aby uzyskać próbkę n niezależnych zmiennych losowych, które mają wspólną funkcję masy f, używana jest próbka (x, n, replace=TRUE, prob=f).
Ustalono, że 1 jest najmniejszą reprezentowaną wartością, a 4 największą ze wszystkich. Jeśli polecenie prob=f zostanie pominięte, próbka będzie próbkować równomiernie od wartości w wektorze x. Możesz porównać symulację z funkcją masy, która wygenerowała dane, patrząc na podwójny znak równości==. I przeliczanie obserwacji, które przyjmują każdą możliwą wartość dla x. Możesz zrobić stół. Powtórz to dla 1000 i porównaj symulację z odpowiednią funkcją masy.
Ilustracja przekształcenia prawdopodobieństwa
Najpierwsymulować jednorodne rozkłady zmiennych losowych u1, u2,.,,, un na przedziale [0, 1]. Około 10% liczb powinno mieścić się w zakresie [0, 3, 0, 4]. Odpowiada to 10% symulacji na przedziale [0, 28, 0, 38] dla zmiennej losowej z pokazaną funkcją rozkładu FX. Podobnie około 10% liczb losowych powinno znajdować się w przedziale [0, 7, 0, 8]. Odpowiada to 10% symulacjom na przedziale [0, 96, 1, 51] zmiennej losowej z dystrybuantą FX. Te wartości na osi x można uzyskać, biorąc odwrotność z FX. Jeśli X jest ciągłą zmienną losową z gęstością fX dodatnią wszędzie w swojej dziedzinie, wówczas funkcja rozkładu jest ściśle rosnąca. W tym przypadku FX ma odwrotną funkcję FX-1 znaną jako funkcja kwantylowa. FX (x) u tylko wtedy, gdy x FX-1 (u). Transformacja prawdopodobieństwa wynika z analizy zmiennej losowej U=FX (X).
FX ma zakres od 0 do 1. Nie może być poniżej 0 ani powyżej 1. Dla wartości u od 0 do 1. Jeśli można zasymulować U, to zmienna losowa z rozkładem FX musi być symulowane za pomocą funkcji kwantylowej. Weź pochodną, aby zobaczyć, że gęstość u zmienia się w zakresie 1. Ponieważ zmienna losowa U ma stałą gęstość w przedziale jej możliwych wartości, nazywa się ją jednolitą w przedziale [0, 1]. Jest modelowany w języku R za pomocą polecenia runif. Tożsamość nazywa się transformacją probabilistyczną. Możesz zobaczyć, jak to działa na przykładzie tarczy do rzutek. X między 0 a 1, funkcjarozkład u=FX (x)=x2, a więc funkcja kwantylowa x=FX-1 (u). Możliwe jest modelowanie niezależnych obserwacji odległości od środka panelu rzutek, a tym samym tworzenie jednolitych zmiennych losowych U1, U2,.,, j.m. Funkcja rozkładu i funkcja empiryczna opierają się na 100 symulacjach rozkładu tarczy do rzutek. Dla wykładniczej zmiennej losowej przypuszczalnie u=FX (x)=1 - exp (- x), a zatem x=- 1 ln (1 - u). Czasami logika składa się z równoważnych stwierdzeń. W takim przypadku musisz połączyć dwie części argumentu. Tożsamość przecięcia jest podobna dla wszystkich 2 {S i i} S, zamiast pewnej wartości. Unia Ci jest równa przestrzeni stanów S i każda para wzajemnie się wyklucza. Ponieważ Bi - dzieli się na trzy aksjomaty. Każda kontrola jest oparta na odpowiednim prawdopodobieństwie P. Dla dowolnego podzbioru. Używanie tożsamości, aby upewnić się, że odpowiedź nie zależy od tego, czy uwzględnione są punkty końcowe interwału.
Funkcja wykładnicza i jej zmienne
Dla każdego wyniku we wszystkich zdarzeniach ostatecznie używana jest druga właściwość ciągłości prawdopodobieństw, która jest uważana za aksjomatyczną. Z prawa rozkładu funkcji zmiennej losowej wynika, że każda ma swoje rozwiązanie i odpowiedź.