Podstawowe pojęcia statystyki matematycznej. Zastosowanie statystyki matematycznej

Spisu treści:

Podstawowe pojęcia statystyki matematycznej. Zastosowanie statystyki matematycznej
Podstawowe pojęcia statystyki matematycznej. Zastosowanie statystyki matematycznej
Anonim

Statystyki matematyczne to metodologia, która pozwala podejmować świadome decyzje w obliczu niepewnych warunków. Ta gałąź matematyki zajmuje się badaniem metod zbierania i systematyzowania danych, przetwarzania końcowych wyników eksperymentów i eksperymentów z losowością masową oraz odkrywania wszelkich wzorców. Rozważ podstawowe pojęcia statystyki matematycznej.

Różnica z teorią prawdopodobieństwa

Metody statystyki matematycznej ściśle przecinają się z teorią prawdopodobieństwa. Obie gałęzie matematyki zajmują się badaniem wielu zjawisk losowych. Obie dyscypliny łączą twierdzenia graniczne. Istnieje jednak duża różnica między tymi naukami. Jeśli teoria prawdopodobieństwa określa charakterystykę procesu w świecie rzeczywistym na podstawie modelu matematycznego, to statystyka matematyczna robi coś przeciwnego – ustawia właściwości modelu nana podstawie zaobserwowanych informacji.

Teoria prawdopodobieństwa i mat. Statystyka
Teoria prawdopodobieństwa i mat. Statystyka

Kroki

Zastosowanie statystyki matematycznej można przeprowadzić tylko w odniesieniu do zdarzeń lub procesów losowych, a raczej do danych uzyskanych z ich obserwacji. I dzieje się to w kilku etapach. Po pierwsze, dane z eksperymentów i eksperymentów podlegają pewnemu przetwarzaniu. Są uporządkowane dla jasności i łatwości analizy. Następnie dokonuje się dokładnego lub przybliżonego oszacowania wymaganych parametrów obserwowanego procesu losowego. Mogą to być:

  • ocena prawdopodobieństwa zdarzenia (jego prawdopodobieństwo jest początkowo nieznane);
  • badanie zachowania nieokreślonej funkcji rozkładu;
  • szacowanie oczekiwań;
  • oszacowanie wariancji
  • itd.
Podstawy mat. Statystyka
Podstawy mat. Statystyka

Trzeci etap to weryfikacja wszelkich hipotez postawionych przed analizą, czyli uzyskanie odpowiedzi na pytanie, jak wyniki eksperymentów mają się do obliczeń teoretycznych. W rzeczywistości jest to główny etap statystyki matematycznej. Przykładem może być rozważenie, czy zachowanie obserwowanego procesu losowego mieści się w normalnym rozkładzie.

Populacja

Podstawowe pojęcia statystyki matematycznej obejmują populacje ogólne i populacje próbne. Dyscyplina ta zajmuje się badaniem zbioru pewnych przedmiotów w odniesieniu do pewnej własności. Przykładem jest praca taksówkarza. Rozważ te zmienne losowe:

  • obciążenie lub liczba klientów: dziennie, przed obiadem, po obiedzie, …;
  • średni czas podróży;
  • liczba napływających wniosków lub ich przywiązanie do dzielnic miasta i wiele więcej.

Warto również zauważyć, że możliwe jest badanie zestawu podobnych procesów losowych, które również będą zmienną losową, którą można zaobserwować.

Populacja
Populacja

Tak więc w metodach statystyki matematycznej cały zbiór badanych obiektów lub wyniki różnych obserwacji przeprowadzonych w tych samych warunkach na danym obiekcie nazywany jest populacją ogólną. Innymi słowy, ściślej matematycznie, jest to zmienna losowa zdefiniowana w przestrzeni zdarzeń elementarnych, z wyznaczoną w niej klasą podzbiorów, których elementy mają znane prawdopodobieństwo.

Populacja próbki

Zdarzają się przypadki, kiedy z jakiegoś powodu (koszt, czas) jest niemożliwe lub niepraktyczne prowadzenie ciągłych badań w celu zbadania każdego obiektu. Na przykład otwieranie każdego słoika zapieczętowanego dżemu w celu sprawdzenia jego jakości jest wątpliwą decyzją, a próba oszacowania trajektorii każdej cząsteczki powietrza w metrze sześciennym jest niemożliwa. W takich przypadkach stosuje się metodę obserwacji wybiórczej: z populacji ogólnej wybierana jest pewna liczba obiektów (najczęściej losowo) i poddawana ich analizie.

Próbka od generałaagregaty
Próbka od generałaagregaty

Te koncepcje mogą początkowo wydawać się skomplikowane. Dlatego, aby w pełni zrozumieć temat, musisz przestudiować podręcznik V. E. Gmurmana „Teoria prawdopodobieństwa i statystyka matematyczna”. Tak więc zbiór próbny lub próbka to seria obiektów wybranych losowo ze zbioru ogólnego. W ścisłym ujęciu matematycznym jest to sekwencja niezależnych, równomiernie rozłożonych zmiennych losowych, z których rozkład pokrywa się z rozkładem wskazanym dla ogólnej zmiennej losowej.

Podstawowe koncepcje

Przyjrzyjmy się pokrótce kilku innym podstawowym pojęciom statystyki matematycznej. Liczba obiektów w ogólnej populacji lub próbce nazywana jest objętością. Przykładowe wartości, które uzyskuje się podczas eksperymentu, nazywane są realizacją próbki. Aby oszacowanie populacji ogólnej na podstawie próby było wiarygodne, ważne jest posiadanie tak zwanej próby reprezentatywnej lub reprezentatywnej. Oznacza to, że próba musi w pełni reprezentować populację. Można to osiągnąć tylko wtedy, gdy wszystkie elementy populacji mają równe prawdopodobieństwo znalezienia się w próbie.

Podstawowe koncepcje
Podstawowe koncepcje

Próbki rozróżniają zwrot i brak zwrotu. W pierwszym przypadku w treści próbki element powtarzany jest zwracany do zbioru ogólnego, w drugim nie. Zwykle w praktyce stosuje się pobieranie próbek bez zamienników. Należy również zauważyć, że liczebność populacji ogólnej zawsze znacznie przewyższa liczebność próby. Istniećwiele opcji procesu próbkowania:

  • proste - przedmioty są losowo wybierane pojedynczo;
  • wpisane - ogólna populacja jest podzielona na typy, z których dokonuje się wyboru; przykładem jest ankieta mieszkańców: osobno mężczyzn i kobiet;
  • mechaniczny - na przykład wybierz co 10 element;
  • serial - wybór odbywa się w serii elementów.

Rozkład statystyczny

Według Gmurmana teoria prawdopodobieństwa i statystyka matematyczna to niezwykle ważne dyscypliny w świecie nauki, zwłaszcza w jego części praktycznej. Rozważ rozkład statystyczny próby.

Załóżmy, że mamy grupę uczniów, którzy przeszli test z matematyki. W rezultacie mamy zestaw szacunków: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - to jest nasz podstawowy materiał statystyczny.

Przede wszystkim musimy go posortować lub wykonać operację rankingu: 1, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5 - iw ten sposób uzyskać szereg wariacyjny. Liczba powtórzeń każdej z ocen nazywana jest częstotliwością oceny, a ich stosunek do wielkości próby nazywany jest częstotliwością względną. Stwórzmy tabelę rozkładu statystycznego próby lub po prostu serię statystyczną:

ai 1 2 3 4 5
pi 1 1 2 4 3

lub

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Miejmy zmienną losową, na której przeprowadzimy serię eksperymentów i zobaczymy, jaką wartość przyjmie ta zmienna. Załóżmy, że przyjęła wartość a1 - m1 razy; a2 - m2 razy itd. Wielkość tej próbki będzie wynosić m1 + … + mk=m. Zbiór ai, gdzie i zmienia się od 1 do k, jest szeregiem statystycznym.

Rozkład interwałowy

W książce VE Gmurmana „Teoria prawdopodobieństwa i statystyka matematyczna” przedstawiono również przedziałowy szereg statystyczny. Jego zestawienie jest możliwe, gdy wartość badanej cechy jest ciągła w określonym przedziale, a liczba wartości jest duża. Rozważmy grupę uczniów, a raczej ich wzrost: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - łącznie 30 uczniów. Oczywiście wzrost osoby jest wartością ciągłą. Musimy zdefiniować krok interwałowy. W tym celu używana jest formuła Sturges.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Zatem jako wielkość przedziału można przyjąć wartość 6. Należy również powiedzieć, że wartość 1+log2m jest wzorem naokreślenie liczby interwałów (oczywiście z zaokrągleniem). W ten sposób, zgodnie ze wzorami, uzyskuje się 6 przedziałów, z których każdy ma rozmiar 6. A pierwszą wartością początkowego przedziału będzie liczba określona wzorem: min - h / 2=156 - 6/2=153. Zróbmy tabelę zawierającą przedziały i liczbę uczniów, których wzrost mieścił się w określonym przedziale.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Oczywiście to nie wszystko, ponieważ w statystyce matematycznej jest znacznie więcej wzorów. Rozważyliśmy tylko kilka podstawowych pojęć.

Harmonogram dystrybucji

Wykresy dystrybucji
Wykresy dystrybucji

Podstawowe pojęcia statystyki matematycznej obejmują również graficzną reprezentację rozkładu, która wyróżnia się przejrzystością. Istnieją dwa rodzaje wykresów: wielokąt i histogram. Pierwszy służy do dyskretnych szeregów statystycznych. A dla rozkładu ciągłego odpowiednio drugi.

Zalecana: