Przedział ufności - nieznane odchylenie stand.

Otrzymałeś(aś) rozwiązanie do zamieszczonego zadania? - podziękuj autorowi rozwiązania! Kliknij
karol221-10
Witam na forum
Witam na forum
Posty: 7
Rejestracja: 23 mar 2017, 20:18
Podziękowania: 1 raz
Płeć:
Kontakt:

Przedział ufności - nieznane odchylenie stand.

Post autor: karol221-10 »

Powtarzam sobie estymację przedziałową i mam wątpliwości czy dobrze rozumiem pewną rzecz.
Mamy np.: takie zadanie. W celu oszacowania średniego czasu poświęconego tygodniowo przez studentów na naukę, wylosowano próbę n=132 studentów i otrzymano wyniki:
0-2: 10
2-4: 28
6-8: 30
8-10: 15
10-12: 7
Estymujemy wartość oczekiwaną, więc musimy użyć wzoru:
\(P( \kre{x}-uB* \frac{s}{ \sqrt{n} }<m< \kre{x}+uB* \frac{s}{ \sqrt{n} })= \alpha\)
Nie znamy ani wartości oczekiwanej ani odchylenia standardowego, więc musimy to policzyć.
Ze średnią nie ma problemu. Ale mam dylemat, jak policzyć odchylenie standardowe/wariancję.
Czy skorzystać ze wzoru:
1.\(s= \frac{1}{n} \sum_{i=1}^{n}(xi- \kre{x})^2\)
czy
2.\(s= \frac{1}{n-1} \sum_{i=1}^{n}(xi- \kre{x})^2\)
Zastosowanie którego wzoru jest bardziej poprawne? Czy wzór nr 1 stosujemy wtedy, gdy mamy próbkę<30, a w przeciwnym wypadku drugi czy zależy to od czegoś innego?
Awatar użytkownika
panb
Expert
Expert
Posty: 5122
Rejestracja: 26 kwie 2010, 22:54
Lokalizacja: Nowiny Wielkie
Podziękowania: 19 razy
Otrzymane podziękowania: 2053 razy
Płeć:

Post autor: panb »

Zasada jest taka.
Jeżeli nie znamy rozkładu populacji, to próba musi być duża. Wtedy bierzemy wzór 1.
Jeżeli próba jest mała, to musimy wiedzieć, że ma rozkład normalny. Wtedy przy znanym \(\sigma\) do określenia przedziału używamy rozkładu normalnego (\(u_\alpha\) i \(\sigma\)), a przy nieznanym \(\sigma\) rozkładu t-studenta (\(t_{\alpha, n-1}\) i s numer 1 albo numer 2) .

Próbę uznaje się za dużą, jeśli n>120. Czasami wystarcza już n>30.
-----------
Dygresja.
Chodzi o to, że jeśli nie znamy rozkładu populacji, z której pochodzi próba, to jeśli próba jest mała, nie można szacować wariancji całej populacji na podstawie wariancji tej próby.
Jeśli wiemy, że populacja ma rozkład normalny, to wzór numer 2 jest lepszym (nieobciążonym) estymatorem nieznanej wariancji niż wzór numer 1.
ODPOWIEDZ