Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 3. Deskriptivna statistika i grafičko predstavljanje podataka

3.2. Mjere varijabiliteta

Mjere centralne tendencije predstavljaju samo jedan aspekt analize i kao jedini aspekt nedovoljne su za potpuni opis distribucije analiziranog obilježja. Zato, uz mjere centralne tendencije obično se analiziraju i mjere varijabiliteta ili disperzije. Veoma često se dešava da dva obilježja imaju slične neke od mjera centralne tendecije, a veoma različite mjere varijabiliteta. Najčešće korišćene mjere varijabiliteta jesu: interval varijacije, interkvartilna razlika, srednje apsolutno odstupanje, varijansa, standardna devijacija i koeficijent varijacije. Slično kao i kod mjera centralne tendecije i mjere varijabiliteta imaju pozicione mjere odnosno mjere koje se računaju na osnovu pozicija vrijednosti analiziranog obilježja. Dvije pozicione mjere varijabiliteta jesu interval varijacije i interkvartilna razlika.

Interval varijacije predstavlja razliku između najveće i najmanje vrijednosti obilježja.

Da bi se smanjio uticaj krajnjih vrijednosti obilježja, koja se često mogu veoma razlikovati od ostalih vrijednosti, izračunava se druga poziciona mjera varijabiliteta i to interkvartilna razlika. Ona predstavlja razliku između vrijednosti koja dijeli obilježje u razmjeri 3 : 1 (treći kvartil) i vrijednosti koja dijeli obilježje u razmjeri 1 : 3 (prvi kvartil).

Srednje apsolutno odstupanje predstavlja srednju vrijednost sume apsolutnih odstupanja svih vrijednosti obilježja od aritmetičke sredine tog obilježja. Zbog osobine aritmetičke sredine da je suma odstupanja od aritmetičke sredine jednaka nuli, srednje apsolutno odsutpanje sumira apsolutne vrijednosti tih odstupanja.

Varijansa predstavlja srednje kvadratno odstupanje svih vrijednosti obilježja od aritmetičke sredine tog obilježja.

Kvadratni korijen varijanse predstavlja standardnu devijaciju.

Od navedenih mjera varijabiliteta, jedino koeficijent varijacije predstavlja relativnu mjeru i računa se kao količnik standardne devijacije i aritmetičke sredine analiziranog obilježja.

Sljedeća tabela daje pregled formula računanja mjera varijabiliteta negrupisanih i grupisanih (gdje je primjenljivo) podataka:

Mjere varijabiliteta

Negrupisani podaci

Grupisani podaci

Interval varijacije

Interkvartilna razlika

Srednje apsolutno odstupanje

Varijansa

Standardna devijacija

Koeficijent varijacije

Primjer 21: Za podatke iz Primjera 16 izračunati mjere varijabiliteta.

> iznos.kredita <- c(10e3, 8.5e3, 2.5e3, 12.7e3, 5.6e3)
> #interval varijacije
> max(iznos.kredita) - min(iznos.kredita)
[1] 10200
> #interkvartilna razlika
> as.numeric(quantile(iznos.kredita, prob = 0.75) - quantile(iznos.kredita, prob = 0.25))
[1] 4400
> IQR(iznos.kredita)
[1] 4400
> #srednje apsolutno odstupanje
> sum(abs(iznos.kredita - mean(iznos.kredita))) / (length(iznos.kredita) - 1)
[1] 3810
> #varijansa
> sum((iznos.kredita - mean(iznos.kredita))^2) / (length(iznos.kredita) - 1)
[1] 15563000
> var(iznos.kredita)
[1] 15563000
> #standardna devijacija
> sqrt(sum((iznos.kredita - mean(iznos.kredita))^2) / (length(iznos.kredita) - 1))
[1] 3944.997
> sd(iznos.kredita)
[1] 3944.997
> #koeficijent varijacije
> sd(iznos.kredita) / mean(iznos.kredita)
[1] 0.501908

Napomena: U zavisnosti od tipa i nivoa mjerenja obilježja, treba ispitati koju je mjeru centralne tendencije i varijabiliteta smisleno računati.

Previous3.1. Mjere centralne tendencijeNext3.3. Mjere oblika rasporeda

Last updated 4 years ago

Was this helpful?

i=Xmax−Xmini = X_{max} - X_{min}i=Xmax​−Xmin​
i=Xmax−Xmini = X_{max} - X_{min}i=Xmax​−Xmin​
IQR=Q3−Q1IQR = Q_3 - Q_1IQR=Q3​−Q1​
SAO=∑in∣Xi−Xˉ∣n−1SAO = \frac{\sum_{i}^{n}\lvert{X_i} - \bar{X} \rvert}{n-1}SAO=n−1∑in​∣Xi​−Xˉ∣​
SAO=∑infi∣Xi−Xˉ∣∑inf1−1SAO = \frac{\sum_{i}^{n}{f_i}\lvert{X_i} - \bar{X} \rvert}{\sum_{i}^{n}{f_1} - 1}SAO=∑in​f1​−1∑in​fi​∣Xi​−Xˉ∣​
s2=∑in(Xi−Xˉ)2n−1s^2 = \frac{\sum_{i}^{n}{{(X_i - \bar{X}})^{2}}}{n-1}s2=n−1∑in​(Xi​−Xˉ)2​
s2=∑infi(Xi−Xˉ)2∑infis^2 = \frac{\sum_{i}^{n}{{f_i(X_i - \bar{X}})^{2}}}{\sum_{i}^{n}{f_i}}s2=∑in​fi​∑in​fi​(Xi​−Xˉ)2​
s=∑in(Xi−Xˉ)2n−1s =\sqrt{\frac{\sum_{i}^{n}{{(X_i - \bar{X}})^{2}}}{n-1}}s=n−1∑in​(Xi​−Xˉ)2​​
s=∑infi(Xi−Xˉ)2∑infis = \sqrt{\frac{\sum_{i}^{n}{{f_i(X_i - \bar{X}})^{2}}}{\sum_{i}^{n}{f_i}}}s=∑in​fi​∑in​fi​(Xi​−Xˉ)2​​
CV=sXˉCV = \frac{s}{\bar{X}}CV=Xˉs​
CV=sXˉCV = \frac{s}{\bar{X}}CV=Xˉs​