Jak obliczyć wariancję: wyjaśnienie z przykładami

Spisu treści:

Jak obliczyć wariancję: wyjaśnienie z przykładami
Jak obliczyć wariancję: wyjaśnienie z przykładami
Anonim

Teoria prawdopodobieństwa działa ze zmiennymi losowymi. Dla zmiennych losowych istnieją tak zwane prawa dystrybucji. Takie prawo opisuje swoją zmienną losową z absolutną kompletnością. Jednak podczas pracy z rzeczywistymi zestawami zmiennych losowych często bardzo trudno jest od razu ustalić prawo ich rozkładu i ograniczają się one do pewnego zestawu cech liczbowych. Na przykład obliczenie średniej i wariancji zmiennej losowej jest często bardzo przydatne.

Dlaczego jest to potrzebne

Jeśli istota matematycznego oczekiwania jest zbliżona do średniej wartości wielkości, to w tym przypadku rozproszenie mówi, jak wartości naszej wielkości są rozproszone wokół tego matematycznego oczekiwania. Na przykład, jeśli zmierzyliśmy IQ grupy osób i chcemy zbadać wyniki pomiaru (próba), oczekiwanie matematyczne pokaże przybliżoną średnią wartość ilorazu inteligencji dla tej grupy osób, a jeśli obliczymy wariancję próbki, dowiemy się, w jaki sposób wyniki są pogrupowane wokół matematycznego oczekiwania: kilka blisko niego (mała zmienność IQ) lub bardziej równomiernie w całym zakresie od minimalnego do maksymalnego wyniku (duża zmienność i gdzieś pośrodku - oczekiwanie matematyczne).

Do obliczenia wariancji potrzebna jest nowa charakterystyka zmiennej losowej - odchylenie wartości od wartości matematycznejczekam.

Odchylenie

Aby zrozumieć, jak obliczyć wariancję, musisz najpierw zrozumieć odchylenie. Jego definicja to różnica między wartością, jaką przyjmuje zmienna losowa, a jej matematycznym oczekiwaniem. Z grubsza mówiąc, aby zrozumieć, w jaki sposób wartość jest „rozproszona”, musisz przyjrzeć się, jak rozkłada się jej odchylenie. Oznacza to, że zastępujemy wartość wartości wartością jej odchylenia od maty. oczekiwania i zbadać prawo dystrybucji.

Prawo rozkładu zmiennej dyskretnej, czyli zmiennej losowej, która przyjmuje poszczególne wartości, jest zapisane w postaci tabeli, gdzie wartość wartości jest skorelowana z prawdopodobieństwem jej wystąpienia. Wówczas w prawie rozkładu odchyleń zmienna losowa zostanie zastąpiona jej wzorem, w którym występuje wartość (która zachowała swoje prawdopodobieństwo) i jej własną matę. czekam.

Własności prawa rozkładu odchylenia zmiennej losowej

Spisaliśmy prawo rozkładu dla odchylenia zmiennej losowej. Możemy z niego wydobyć do tej pory tylko taką cechę, jak oczekiwanie matematyczne. Dla wygody lepiej wziąć przykład liczbowy.

Niech będzie prawo rozkładu pewnej zmiennej losowej: X - wartość, p - prawdopodobieństwo.

prawo dystrybucyjne
prawo dystrybucyjne

Obliczamy oczekiwanie matematyczne za pomocą wzoru i natychmiastowo odchylenie.

Wartość oczekiwana
Wartość oczekiwana

Rysowanie nowej tabeli rozkładu odchyleń.

Prawo dystrybucji dla odchylenia
Prawo dystrybucji dla odchylenia

Również tutaj obliczamy oczekiwania.

Matematyczne oczekiwanie na odchylenie
Matematyczne oczekiwanie na odchylenie

Okazuje się zero. Przykład jest tylko jeden, ale tak będzie zawsze: nie jest trudno to udowodnić w ogólnym przypadku. Wzór na matematyczne oczekiwanie odchylenia można rozłożyć na różnicę między matematycznymi oczekiwaniami zmiennej losowej i, bez względu na to, jak krzywo może to brzmieć, matematycznym oczekiwaniem maty. oczekiwania (jednakże rekurencja), które są takie same, stąd ich różnica będzie wynosić zero.

To jest oczekiwane: w końcu odchylenia znaku mogą być zarówno dodatnie, jak i ujemne, dlatego średnio powinny dawać zero.

Jak obliczyć wariancję przypadku dyskretnego. ilości

Jeśli mat. nie ma sensu obliczać oczekiwanego odchylenia, trzeba szukać czegoś innego. Możesz po prostu wziąć wartości bezwzględne odchyleń (modulo); ale w przypadku modułów wszystko nie jest takie proste, więc odchylenia są podnoszone do kwadratu, a następnie obliczane jest ich matematyczne oczekiwanie. Właściwie o to chodzi, gdy mówią o tym, jak obliczyć wariancję.

To znaczy, bierzemy odchylenia, podnosimy je do kwadratu i tworzymy tabelę kwadratów odchyleń i prawdopodobieństw, które odpowiadają zmiennym losowym. To jest nowe prawo dystrybucji. Aby obliczyć oczekiwanie matematyczne, musisz dodać iloczyny kwadratu odchylenia i prawdopodobieństwa.

Łatwiejsza formuła

Jednak artykuł zaczął się od tego, że prawo rozkładu początkowej zmiennej losowej jest często nieznane. Potrzebne jest więc coś lżejszego. Rzeczywiście, istnieje inny wzór, który pozwala obliczyć wariancję próbki przy użyciu tylko maty.czekam:

Dyspersja - różnica między matami. oczekiwanie kwadratu zmiennej losowej i odwrotnie, kwadrat jej maty. czekam.

Istnieje na to dowód, ale przedstawianie go tutaj nie ma sensu, ponieważ nie ma to praktycznej wartości (a wystarczy obliczyć wariancję).

Jak obliczyć wariancję zmiennej losowej w szeregu wariacyjnym

W rzeczywistych statystykach nie jest możliwe odzwierciedlenie wszystkich zmiennych losowych (ponieważ z grubsza jest ich nieskończenie wiele). Dlatego do badania trafia tzw. próba reprezentatywna z pewnej ogólnej populacji. A ponieważ cechy liczbowe dowolnej zmiennej losowej z takiej populacji ogólnej są obliczane na podstawie próbki, nazywa się je odpowiednio próbą: średnia próbki, odpowiednio wariancją próby. Możesz to obliczyć w taki sam sposób jak zwykle (poprzez kwadrat odchylenia).

Wariancja obciążona próbą
Wariancja obciążona próbą

Jednak takie rozproszenie nazywa się stronniczym. Nieco inaczej wygląda bezstronna formuła wariancji. Zwykle jest to wymagane do obliczenia.

Przykładowa bezstronna wariancja
Przykładowa bezstronna wariancja

Mały dodatek

Jeszcze jedna cecha numeryczna związana jest z dyspersją. Służy również do oceny, w jaki sposób zmienna losowa rozprasza się po swojej macie. oczekiwania. Nie ma dużej różnicy w sposobie obliczania wariancji i odchylenia standardowego: to drugie jest pierwiastkiem kwadratowym z pierwszego.

Zalecana: