W celu ustalenia przeciętnej ceny owoców sprzedawanych na targowiskach w mieście X przeprowadzono obserwację cen w poszczególnych stoiskach. Uzyskano następujące dane: (ceny w zł za 1 kg – dane umowne): 5, 8, 7, 5, 6, 8, 10, 12, 10, 11, 8, 8, 9, 6, 10, 11, 8, 9, 12, 8, 7, 8, 9, 12, 6, 11, 13, 15, 5, 6, 7, 8, 9, 8, 8, 4, 5, 8, 8. Która z miar najlepiej charakteryzuje centralną tendencję kształtowania się ceny tych owoców i dlaczego?
Jakaś dobra dusza pomoże w rozwiązaniu lub chociaż naprowadzi na właściwy tor? Będę wdzięczny za pomoc.
Statystyka - mediana lub średnia
Otrzymałeś(aś) rozwiązanie do zamieszczonego zadania? - podziękuj autorowi rozwiązania! Kliknij
-
- Fachowiec
- Posty: 1039
- Rejestracja: 04 sty 2020, 12:47
- Podziękowania: 9 razy
- Otrzymane podziękowania: 388 razy
- Płeć:
Re: Statystyka - mediana lub średnia
Wszystko widać na histogramie. Zrobię go w R
Widzimy, że cena 8 jest najczęstsza i w porównaniu do innych cen zdecydowanie częstsza. Dlatego znacznie zawyża średnią arytmetyczną, co będzie niemiarodajną oceną średniej ceny owoców. Dlatego warto użyć mediany.
Różnica między średnią a medianą to 40 gr. Może to być dość dużo.
Kod: Zaznacz cały
library(ggplot2)
ceny<-data.frame(cena=c(5,8,7,5,6,8,10,12,10,11,8,8,9,6,10,11,8,9,12,8,7,8,9,12,6,11,13,15,5,6,7,8,9,8,8,4,5,8,8))
ggplot(ceny,(aes(cena)))+geom_histogram()
Kod: Zaznacz cały
> mean(ceny$cena)
[1] 8.410256
> median(ceny$cena)
[1] 8
Re: Statystyka - mediana lub średnia
Uporządkowałem rosnąco i mam N=39 natomiast Me=8 i jako, że ilość wystąpień jest nieparzysta przyjąłem, że N+1/2 czyli 39+1/2 co daje 20 liczbą w przedziale. Natomiast średnia arytmetyczna to 328/39 co daje w przybliżeniu 8,41. Dokładniejsza wydaje mi się średnia w tym przypadku, ale czy jest bardziej właściwa od mediany? Tak naprawdę do miary tendencji centralnej zalicza się średnia i mediana i obie są właściwe. Czy brać pod uwagę odchylenie w przedziale w postaci liczby 15 i braku ciągłości w postaci 14? Czy w tym zadaniu brać pod uwagę kg? No i nie wiem w jaki sposób mogłaby być sformułowana odpowiedź.
-
- Fachowiec
- Posty: 1039
- Rejestracja: 04 sty 2020, 12:47
- Podziękowania: 9 razy
- Otrzymane podziękowania: 388 razy
- Płeć:
Re: Statystyka - mediana lub średnia
Kwestia, na ile można uznać, że 41 gr ze średniej zawyża średnią cenę. Jeśli towar kosztuje 8 zł,, to 8.40 to o 5% więcej... Jeśli podwyżkę o 5% uznamy za mało znaczącą, to obie miary są równie dobre. Jeśli jednak nie będziemy tego akceptowali, to lepsza będzie mediana. Znacznie wyższa liczba ósemek w ciągu wpływa na średnią i ją zawyża.
Można jeszcze zbadać asymetrię rozkładu (w rozkładach symetrycznych średnia jest równa medianie).
Rozkład cechuje się dość dużą asymetrią prawostronną, więc może wystąpić znaczna różnica między średnią a medianą.
Można jeszcze zbadać asymetrię rozkładu (w rozkładach symetrycznych średnia jest równa medianie).
Kod: Zaznacz cały
> m<-mean(ceny$cena)
> s<-sd(ceny$cena)
> m3<-mean((ceny$cena-m)^3)
> a<-m3/s^3
> a
[1] 0.478608
- panb
- Expert
- Posty: 5122
- Rejestracja: 26 kwie 2010, 22:54
- Lokalizacja: Nowiny Wielkie
- Podziękowania: 19 razy
- Otrzymane podziękowania: 2053 razy
- Płeć:
Re: Statystyka - mediana lub średnia
Tak, ale dominanta zwraca uwagę na tę asymetrię. Mówi, że większość wyników to 8, a nie że połowa jest mniejsza, a połowa większa od 8.
-
- Fachowiec
- Posty: 1039
- Rejestracja: 04 sty 2020, 12:47
- Podziękowania: 9 razy
- Otrzymane podziękowania: 388 razy
- Płeć:
Re: Statystyka - mediana lub średnia
Dokładnie o kierunku asymetrii przesądza różnica pomiędzy średnią a dominantą. Ja w badaniu użyłem klasycznego współczynnika asymetrii \(A=\dfrac{M_3}{s^3}\), gdzie \(M_3=\displaystyle\frac{1}{n}\sum_{k=1}^n(x_k-\bar{x})^3\) jest trzecim momentem centralnym.