Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 6. Statističko testiranje hipoteza
  2. 6.8. Testovi normalnosti

6.8.2. Pearsonov hi-kvadrat test normalnosti

Pearsonov hi-kvadrat test odnosi se na kvalitativni set podataka i testira da li postoji statistički značajno odstupanje distribucije realizovanih podataka od distribucije očekivanih podataka (normalnog rasporeda u ovom slučaju). Primjena hi-kvadrat testa u praksi daleko je šira od primjene testiranja normalnosti. Test statistika računa se po sljedećoj formuli:

Pχ2=∑i=1c(Oi−Ei)2EiP_{\chi^2} = \sum_{i=1}^{c}\frac{(O_i - E_i)^{2}}{E_i}Pχ2​=i=1∑c​Ei​(Oi​−Ei​)2​

gdje OiO_iOi​ predstavlja broj realizovanih vrijednosti analiziranog obilježja u iii-toj klasi, EiE_iEi​ broj očekivanih vrijednosti analiziranog obilježja u iii -toj klasi, dok ccc predstavlja ukupan broj klasa u koje su grupisanje vrijednosti obilježja. Nulta hipoteza testa jeste da vrijednost test statistike prati hi-kvadrat raspored sa, u narednom primjeru, c−2−1c - 2 - 1 c−2−1 stepeni slobode, tako da ukoliko je izračunata p vrijednost manja od nivoa značajnosti, u tom slučaju možemo odbaciti nultu hipotezu.

Na osnovu test statistike i generalnog opisa testa, dolazi se do zaključka da numeričko obilježje treba prvo transformisati, pa tek onda implementirati test. Konkretno za primjenu testiranja normalnosti neophodno je odrediti broj klasa, realizovani i očekivani broj opservacija unutar klasa pod pretpostavkom da očekivane vrijednosti prate normalan raspored. Naredni primjer prikazuje jedan od načina određivanja ova dva parametra i primjenu Pearsonovog testa normalnosti.

Primjer 54: Za podatke iz Primjera 53, testirati pretpostavku da vrijednosti analiziranih obilježja prate normalni raspored primjenom Pearson hi-kvadrat testa za nivo značajnosti od 5%.

> alpha <- 0.05
> #korisnicka funkcija
> p.n.test <- function(x) {
+ #ukupan broj opservacija
+ n <- length(x)
+ #predlozeni broj klasa
+ n.classes <- ceiling(2 * (n^(2 / 5)))
+ #realizovan broj opservacija po klasama
+ num <- floor(1 + n.classes * pnorm(x, mean(x), sd(x)))
+ count <- tabulate(num, n.classes)
+ #ocekivani broj opservacija po klasama
+ prob <- rep(1 / n.classes, n.classes)
+ xpec <- n * prob
+ #test statistika
+ P <- sum(((count - xpec)^2) / xpec)
+ p.val <- pchisq(P, n.classes - 2 - 1, lower.tail = FALSE)
+ res <- data.frame(test.stat = P, p.val = p.val)
+ return(res)
+ }
> p.pd <- p.n.test(x = pd$PD)
> p.pd
  test.stat        p.val
1        48 1.427672e-06
> p.pd$p.val < alpha
[1] TRUE
> p.lgdr <- p.n.test(x = lgd$LGDR)
> p.lgdr
  test.stat     p.val
1      18.6 0.6698811
> p.lgdr$p.val < alpha
[1] FALSE
> p.lgde <- p.n.test(x = lgd$LGDE)
> p.lgde
  test.stat    p.val
1        17 0.763362
> p.lgde$p.val < alpha
[1] FALSE
> #r funkcija - paket nortest
> #ukoliko paket nije instaliran pokrenuti prethodno:
> #install.packages("nortest")
> library(nortest)
> pearson.test(pd$PD)

        Pearson chi-square normality test

data:  pd$PD
P = 48, p-value = 1.428e-06

> pearson.test(lgd$LGDR)

        Pearson chi-square normality test

data:  lgd$LGDR
P = 18.6, p-value = 0.6699

> pearson.test(lgd$LGDE)

        Pearson chi-square normality test

data:  lgd$LGDE
P = 17, p-value = 0.7634

Previous6.8.1. Jarque-Bera test normalnostiNext6.9. Testovi homogenosti varijanse

Last updated 4 years ago

Was this helpful?