5. Uzorak i uzoračke ocjene
Pod pojmom populacija u statistici podrazumijeva se skup svih jedinica posmatranja koje imaju određene karakteristike relevantne za neko istraživanje. Za razliku od populacije, uzorak predstavlja slučajno izabrani dio populacije. Ako za cilj statističke analize prihvatimo da je to proces prikupljanja, analize i donošenja zaključaka o populaciji istraživanja, onda se često postavlja pitanje-zašto se za posmatranje obično bira uzorak, a ne cijela populacija. Najčešće, obuhvatanje cijele populacije zahtijeva veliko vrijeme i troškove, pa se umjesto populacije prikupljaju podaci na osnovu reprezentativnog uzorka.
Primjer 35: U fajlu PD.csv dati su podaci o mjesečnim PD-ijevima, za posljednjih 120 mjeseci. Izračunati prosječni PD za cjelokupni period. Zatim, izračunati prosječni PD za slučajno odabrani uzorak od 30 mjeseci bez ponavljanja. Ponoviti proces uzorkovanja još jednom i izračunati pristrasnost uzoračke ocjene posječnog PD-ija u odnosu na cjelokupni dostupan period.
Kao što se može primijetiti pri svakom novom, slučajnom odabiru dobićemo drugačiju vrijednost prosječnog PD-ija.
Pretpostavimo da za vrijednosti PD-ija za svih 120 mjeseci dodatno imamo indikator stanja makroekonomskog okruženja (kolona period u fajlu PD.csv) mjerenog vrijednostima iznad ili ispod prosjeka BDP-a za posmatrani period.
Primjer 36: Ocijenimo prosječnu vrijednost PD-ija (PD.csv) na osnovu uzorka od 60 mjeseci bez ponavljanja i to odabranih na način da se po 30 mjeseci izabere iz oba perioda stanja ekonomije (iznad i ispod prosječnog BDP-a).
Ovakav uzorak naziva se stratifikovani (jer se uzorci biraju iz određenih grupa koje se u teoriji uzorka nazivaju stratumima) i prosječna ocjena nekog obilježja za populaciju razlikuje se od slučajnog prostog uzorka (prethodni primjer). U zavisnosti od alokacije uzorka i alokacionog obilježja, prosječna vrijednost analiziranog obilježja dobija se kao ponderisana prosječna vrijednost (koristi se formula za ponderisanu aritmetičku sredinu) analiziranog obilježja po stratumima. Prateći iste principe i ostali momenti mogu biti izračunati kao što su ponderisana standardna devijacija ili varijansa.
Sama činjenica da se radi ocjena uzorka, a ne ocjena na osnovu cijele populacije, ukazuje na postojanje određene greške ocjene. Kao što je pokazano dva različita uzorka iste veličine mogu imati različite ocjene aritmetičke sredine. Zbog toga kao komplementarna vrijednost, ocjeni aritmetičke sredine, često se pridružuje i standardna greška ocjene aritmetičke sredine. Ujedno ova mjera predstavlja i mjeru preciznosti ocjene. Za prost slučajni uzorak, konačne populacije, standardna greška ocjene aritmetičke sredine računa se po formuli:
Primjer 37: Za uzorački prosječan PD iz Primjera 35 i Primjera 36 izračunati standardnu grešku ocjene. Prilikom obračuna uzeti u obzir korekcioni faktor konačne populacije.
S obzirom na to da distribucija ocijene aritmetičke sredine prati normalni raspored, dostupnost ocjenjene vrijednosti aritmetičke sredine i standardne greške te ocjene, omogućava konstruisanje intervala povjerenja ocijenjene aritmetičke sredine:
Primjer 38: Simulirati i grafički na histogramu predstaviti empirijsku distribuciju aritmetičke sredine PD vrijednosti (fajl PD.csv) koristeći 10000 slučajno odabranih uzoraka i uzoračku frakciju od 30%.
Rezultati Primjera 38 pokazuju osnovanost pretpostavke da distribucija aritmetičke sredine prati normalan raspored. Korišćenjem sličnog principa (uzorkovanje sa ponavljanjem ili bez ponavljanja) moguće je simulirati empirijsku distribuciju nekog drugog deskriptivnog parametra ili test statistike.
Primjer 39: Na osnovu podataka o prosječnim PD-ijevima (Primjer 35 i Primjer 36) i greškama ocjene (Primjer 37), izračunati 95% interval povjerenja ocijenjenih prosječnih vrijednosti.
Last updated
Was this helpful?