Jakie jest główne twierdzenie graniczne?

Jakie jest główne twierdzenie graniczne?
Anonim

Odpowiedź:

Centralne twierdzenie graniczne czyni rygorystycznie intuicyjną ideę, że szacunki średniej (oszacowanej na podstawie pewnej próbki) niektórych pomiarów związanych z pewną populacją poprawiają się wraz ze wzrostem wielkości próbki.

Wyjaśnienie:

Wyobraź sobie las zawierający 100 drzew.

Teraz wyobraź sobie, że (raczej nierealistycznie), że mierzona w metrach jedna czwarta z nich ma wysokość 2, jedna czwarta z nich ma wysokość 3, jedna czwarta z nich ma wysokość 4, a jedna czwarta z nich ma wysokość 5.

Wyobraź sobie, że mierzysz wysokość każdego drzewa w lesie i wykorzystujesz informacje do skonstruowania histogramu z odpowiednio dobranymi rozmiarami pojemników (np. 1,5 do 2,5, 2,5 do 3,5, 3,5 do 4,5 oraz 5,5 do 6,5; zdaję sobie sprawę, że nie sprecyzowałem kosz, do którego należą granice, ale tutaj nie ma znaczenia.

Możesz użyć histogramu do oszacowania rozkładu prawdopodobieństwa drzew. Najwyraźniej nie byłoby to normalne.W rzeczywistości, pod warunkiem, że punkty końcowe zostały odpowiednio dobrane, byłby on jednolity, ponieważ byłaby równa liczba drzew odpowiadająca jednej z określonych wysokości w każdym pojemniku.

Teraz wyobraź sobie, że wchodzisz do lasu i mierzysz wysokość tylko dwóch drzew; oblicz średnią wysokość tych dwóch drzew i zanotuj je. Powtórz tę operację kilka razy, tak abyś miał zbiór wartości średnich dla próbek o rozmiarze 2. Gdybyś miał narysować histogram szacunków średniej, nie byłby już jednolity. Zamiast tego jest prawdopodobne, że będzie więcej pomiarów (oszacowania średniej opartej na próbkach wielkości 2) w pobliżu ogólnej średniej wysokości wszystkich drzew w lesie (w tym konkretnym przypadku,

#(2 + 3 + 4 + 5)/4 = 3.5# metrów).

Jak będzie więcej szacunki średniej w pobliżu prawdziwa populacja średnia (co jest znane w tym nierealistycznym przykładzie), niż daleko od średniej, kształt tego nowego histogramu byłby bliższy rozkładowi normalnemu (ze szczytem w pobliżu średniej).

Teraz wyobraź sobie wchodzenie do lasu i powtarzanie ćwiczenia, z wyjątkiem tego, że mierzysz wysokość 3 drzew, obliczając średnią w każdym przypadku i zanotowując ją. Histogram, który skonstruowałbyś, miałby jeszcze więcej oszacowań średniej w pobliżu prawdziwej średniej, z mniejszą rozpiętością (szansa na wybranie trzech drzew w jednej próbce tak, że wszystkie pochodzą z jednej z grup końcowych --- albo samej wysoki lub bardzo krótki --- jest mniejszy niż zebranie trzech drzew z wyborem wysokości). Kształt histogramu obejmujący oszacowanie średniej wielkości (każda średnia oparta na trzech pomiarach) byłby bliższy rozkładowi normalnemu, a odpowiadające odchylenie standardowe (szacunków średniej, a nie populacji macierzystej) byłoby mniejszy.

Powtórz tę czynność dla 4, 5, 6, itd., Drzew na średnią, a histogram, który skonstruowałbyś, wyglądałby bardziej jak rozkład normalny (z coraz większymi rozmiarami próbek), ze średnią dystrybucja szacunki średniej bliżej prawdziwej średniej i odchylenia standardowego szacunków średniej węższej i węższej.

Jeśli powtórzysz ćwiczenie dla (zdegenerowanego) przypadku, w którym wszystkie drzewa są mierzone (kilkakrotnie, notując średnią w każdym przypadku), to histogram będzie zawierał oszacowania średniej tylko w jednym z pojemników (ten odpowiadający prawdziwej średniej), bez żadnej zmiany, tak że odchylenie standardowe (rozkład prawdopodobieństwa oszacowany z), że „histogram” będzie równe zero.

Tak więc, centralne twierdzenie graniczne zauważa, że średnia pewnego oszacowania średniej pewnej populacji asymptotycznie zbliża się do prawdziwej średniej, a odchylenie standardowe oszacowania średniej (zamiast odchylenia standardowego rozkładu populacji macierzystej) staje się coraz mniejszy dla większych rozmiarów próbek.