Załóżmy, że w ciągu ostatniego roku kalendarzowego obserwuję 10 000 klientów z mojego kina (próbka losowa). Dla każdego klienta wiem, ile pieniędzy wydali w teatrze w ciągu całego roku. Teraz chcę uzyskać oszacowanie, ile zarobię na klientach w nadchodzącym roku.
Jeśli spodziewam się, że w nadchodzącym roku będę miał 2000 klientów, mógłbym wypróbować 2000 klientów z zastępstwem od moich obecnych 10 000 klientów. Chcę móc powiedzieć, że suma wszystkich użytkowników w moim resample byłaby oszacowaniem, którego szukam. Brzmi to dobrze, jeśli założę, że dystrybucja się nie zmieni.
Czy jest z tym jakiś problem? Co się stanie, jeśli spodziewam się, że będzie 20 000 nowych klientów i pobiorę próbki z zamiennikiem od moich 10 000 klientów?
Opierając się na tym, czego dowiedziałem się o statystykach, myślę, że większość ludzi dopasuje model, a następnie użyje go, aby odpowiedzieć na takie pytanie. Jeśli jednak moja początkowa próbka jest wystarczająco duża, to czy ponowne próbkowanie nie jest wystarczająco bliskim przybliżeniem do rozkładu bazowego?
Czy mogę przeprowadzić ponowne próbkowanie zamiast dopasowywania modelu?
Otrzymałeś(aś) rozwiązanie do zamieszczonego zadania? - podziękuj autorowi rozwiązania! Kliknij