Rozklady Statystyk Estymacja
Rozklady Statystyk Estymacja
Studia sobotnio-niedzielne
Motto I: Prawie każdy jest statystykiem ale niewielu o tym wie (inspiratorzy:
Molier i Joseph Schumpeter)
Motto II: Statystyka jest bodajże ostatnim reliktem mistyki dnia codziennego
(Stanisław Lem)
Motto III: In God we trust. All others must bring data (z internetu)
Motto IV: Żadnej sprawiedliwości nie ma i być nie może - dobrze, że jest
statystyka - i z tego trzeba się cieszyć (z „Szewców” Witkacego)
1
Spis treści
2
1. ROZKŁADY STATYSTYK Z PRÓBY
Pytanie:
Czy statystykami z próby są: mediana, rozstęp, wartość maksymalna?
3
1.1. ZNACZENIE ROZKŁADÓW STATYSTYK Z PRÓBY
Pytania:
1. Jak można, zakładając normalny rozkład zmiennej, ustalić czy wartość
oczekiwana średniej z próby jest równa średniej w populacji generalnej? Z
jaką własnością estymatora mają Państwo w tym momencie skojarzenia?
2. Proszę, zakładając dowolny rozkład zmiennej i liczebność próby, podać
sposób obliczania prawdopodobieństwa, że odchylenie wartości estymatora
od parametru nie przekroczy zadanej z góry wartości. Z jakimi aspektami
wnioskowania statystycznego mają Państwo w tym momencie skojarzenia?
4
W większości przypadków użyteczność statystyk z próby nie jest związana
bezpośrednio z ich definicją. Najczęściej postać statystyki testowej jest
odmienna od występujących po prawej stronie równań (1) – (3).
Przykład 1
Rozkład χ2 o n stopniach swobody jest zdefiniowany następująco:
n
= U i2
2
n (1)
i =1
Przykład 2
Rozkład t (Studenta) o n stopniach swobody jest zdefiniowany następująco:
U
tn = n (2)
2
Przykład 3
Rozkład F (Fishera-Snedecora) jest zdefiniowany następująco:
12 / n1
Fn1 / n2 = 2 (3)
2 / n2
5
Pytanie odwołujące się do intuicji:
Jaki rozkład ma statystyka testowa testu specyfikacji RESET dla modelu regresji
z k zmiennymi objaśniającymi):
[ RRSS − URSS ] /( p − 1)
R=
URSS /(n − k − 1)
Pytanie:
Dyskutowany jest problem czy zmiany podatków mają wpływ na zmiany PKB.
W celu weryfikacji tego stwierdzenia należy oszacować model, w którym
zmienną objaśnianą są zmiany PKB, zaś jedną ze zmiennych objaśniających
zmiany podatków.
6
Ostrzeżenie!
Pytanie 1:
Pytanie 2:
7
1.2 STOPNIE SWOBODY
8
Przykładowo, zmienna o rozkładzie χ2 (równanie 1) jest zdefiniowana przez n
zmiennych niezależnych (U), zatem liczba stopni swobody wynosi n. Zmienna o
rozkładzie χ2 zdefiniowana następująco:
(n − 1) S 2 ( X )
=
2
2
ma n-1 stopni swobody, ponieważ jej wartość można wyznaczyć za pomocą n-1
obserwacji, jeżeli znana jest średnia z próby (która musi być obliczona).
9
1.3. ZADANIA
10
b/ Korzystając ze zbieżności rozkładu zmiennej 2 2 z liczbą stopni swobody
n do rozkładu normalnego o parametrach 2n − 1 i 1proszę policzyć
przybliżoną wartość w. w. prawdopodobieństwa dla próby 31 i 61 elementowej,
a następnie porównać analogiczne wyniki uzyskane za pomocą rozkładu χ2.
11
Wskazówka: 0,8415 to prawdopodobieństwo, że zmienna przyjmie wartość
mniejszą niż górne ograniczenie obszaru jednosigmowego.
12
2. ESTYMACJA PARAMETRÓW W POPULACJI GENERALNEJ
Przykłady
• Średnia wartość zmiennej w próbie jest estymatorem średniej w populacji
generalnej (np. na podstawie średniej wartości dochodu w GUS-owskiej
próbie gospodarstw domowych wnioskujemy o średniej dla kraju czy danej
grupy społecznej).
13
2.1. WŁASNOŚCI ESTYMATORÓW
Wybór estymatora:
https://digitalfirst.bfwpub.com/stats_applet/stats_applet_4_ci.html
14
Estymator nieobciążony i obciążony
Źródło: https://www.slideshare.net/ShakeelNouman1/sampling-
and-sampling-distributions
15
Estymator jest zgodny jeżeli błąd absolutny estymacji można dowolnie
zmniejszać, zwiększając liczebność próby.
Źródło: https://www.slideshare.net/ShakeelNouman1/sampling-
and-sampling-distributions
16
Estymator nazywamy efektywnym (można też spotkać się z określeniem
„najefektywniejszy”) jeżeli jego wariancja jest mniejsza od wariancji wszystkich
innych estymatorów (wariancja nieobciążonego estymatora pozwala ocenić
wartość błędu losowego popełnianego przy estymacji: im wyższa wariancja, tym
wyższy błąd).
Źródło: https://www.slideshare.net/ShakeelNouman1/sampling-
and-sampling-distributions
Zadanie:
17
2.2 MATEMATYCZNY ZAPIS WŁASNOŚCI ESTYMATORÓW
1. Nieobciążoność
E (Tn ) = lub
lim E (Tn ) =
n →
2. Zgodność:
Pytanie:
Dlaczego wariancja estymatora (nieobciążonego) jest miarą błędów losowych?
18
Przykład estymatora nieobciążonego:
Dowód:
1 n
1 n 1
E ( X ) = E
n
i −1
xi =
E ( xi ) = nE ( X ) = E ( X )
n i −1 n
19
W ogólnym przypadku zgodność estymatora najwygodniej jest sprawdzić za
pomocą dwóch poniższych twierdzeń.
20
2.3 METODY UZYSKIWANIA ESTYMATORÓW
Jedną ze skuteczniejszych metod uzyskiwania estymatorów jest metoda
największej wiarygodności (MNW). Uzyskane za jej pomocą estymatory są
zgodne, co najmniej asymptotycznie nieobciążone i efektywne.
Do przemyślenia:
W MNW zakłada się, że skoro próba została wylosowana, to znaczy, że
prawdopodobieństwo jej wylosowania było najwyższe. Skądinąd wiadomo, że
założenie to najczęściej nie jest spełnione. Czy to oznacza wyższość estymacji
„tradycyjnej” nad MNW?
Pytanie-wskazówka: odpowiednikiem jakiego założenia w estymacji tradycyjnej
może być to założenie?
21
Przykład: rozkład Poissona i estymacja MNW
k
P( X = k ) = e − (k = 0, 1, 2, ...)
k!
22
Funkcja wiarygodności pozwalająca wyznaczyć prawdopodobieństwo
wylosowania próby ( x1 , x2 ,..., xn ) przy losowaniu niezależnym (ze zwracaniem)
ma następująca postać:
n
xi
L( x1 , x2 ,..., xn , ) = L = x !e
i =1 i
−
n
ln L = (ln x − ln x !− )
i =1
i i
23
Różniczkując tę funkcję po λ i przyrównując ją do zera otrzymuje się równanie:
ln L n
xi
= − 1 = 0
i =1
x
1
̂ = i
n i =1
24
2.4. ZADANIA
1 n
ˆ
S =
2
n − 1 i =1
( xi − X ) 2
(x − X )
1
S =
2
i
2
n i =1
2 σ d= Xi − m
n i
n
x p (1 − p )
w=
3 p n p n
2
4 me mediana m 2n
2
5 m X m n
1 2 4
6 σ 2 Ŝ2 =
n −1 i
(Xi − X ) 2 2
n −1
25
3. Proszę wyznaczyć metodą największej wiarygodności estymatory
parametrów rozkładu normalnego. W wersji łatwiejszej można to zrobić dla
każdego z nich oddzielnie, zakładając znajomość drugiego, w wersji bardziej
ambitnej bez tego założenia, rozwiązując układ równań z dwiema
niewiadomymi.
26