Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 6. Statističko testiranje hipoteza
  2. 6.8. Testovi normalnosti

6.8.1. Jarque-Bera test normalnosti

Jarque-Bera test testira da li vrijednosti analiziranog obilježja prate normalni raspored i to na način što ispituje da li se koeficijent asimetričnosti (engleski skewness) i spljoštenosti (engleski kurtosis) poklapaju sa očekivanim vrijednostima iz normalnog rasporeda (0 i 3). Test statistika ima sljedeću formu:

JB=n6(s2+(k−3)24)JB = \frac{n}{6}(s^2 + \frac{(k-3)^2}{4}) JB=6n​(s2+4(k−3)2​)

gdje nnn predstavlja broj opservacija analiziranog obilježja, sss predstavlja vrijednosti koeficijenta asimetričnosti, dok kkk predstavlja vrijednost koeficijenta spljoštenosti. Izračunata test statistika prati hi-kvadrat raspored sa dva stepena slobode. Nulta hipoteza testa jeste da vrijednosti analiziranog obilježja prate normalni raspored, tako da ukoliko je izračunata p vrijednost manja od nivoa značajnosti, u tom slučaju možemo odbaciti nultu hipotezu.

U zavisnosti od načina računanja koeficijenata asimetričnosti i spljoštenosti moguće je da različiti R paketi daju neznatno drugačije rezultate test statistike. Potencijalna razlika trebalo bi da se odnosi jedino na imenilac izraza za računanje varijanse za koeficijente asimetričnosti i spljoštenosti koja uzima vrijednosti n−1n-1n−1 (obično računat za uzorak) ili nnn (obično računat za populaciju). Naredni primjer pretpostaviće da se koeficijenti oblika distribucije računaju za populaciju, kako bi se reprodukovali isti rezultati implementacije testa iz R paketa tseries.

Primjer 53: Importovati podatke iz fajlova PD.csv i LGD.csv, a zatim testirati normalnost obilježja PD (kolona PD), realizovanog LGD-ija (kolona LGDR) i ocijenjenog LGD-ija (kolona LGDE) primjenom Jarque-Bera testa za nivo značajnosti od 5%.

> #import podataka
> pd <- read.csv("PD.csv", header = TRUE)
> lgd <- read.csv("LGD.csv", header = TRUE)
> #nivo znacajnosti
> alpha <- 0.05
> #korisnicka funkcija
> jb.n.test <- function(x) {
+ n <- length(x)
+ m1 <- sum(x) / n
+ m2 <- sum((x - m1)^2) / n
+ m3 <- sum((x - m1)^3) / n
+ m4 <- sum((x - m1)^4) / n
+ s <- (m3 / m2^(3 / 2))
+ k <- (m4 / m2^2)
+ jb <- (n / 6) * (s^2 + (k - 3)^2 / 4)
+ p.val <- pchisq(jb, df = 2, lower.tail = FALSE)
+ res <- data.frame(test.stat = jb, p.val = p.val)
+ return(res)
+ }
> jb.pd <- jb.n.test(x = pd$PD)
> jb.pd 
  test.stat       p.val
1  9.877431 0.007163795
> jb.pd$p.val < alpha
[1] TRUE
> jb.lgdr <- jb.n.test(x = lgd$LGDR)
> jb.lgdr
  test.stat     p.val
1 0.4815551 0.7860165
> jb.lgdr$p.val < alpha
[1] FALSE
> jb.lgde <-jb.n.test(x = lgd$LGDE)
> jb.lgde
  test.stat     p.val
1  1.404975 0.4953517
> jb.lgde$p.val < alpha
[1] FALSE
> #r funkcija - paket tseries
> #ukoliko paket nije instaliran pokrenuti prethodno:
> #install.packages("tseries")
> library(tseries)
> jarque.bera.test(pd$PD)

        Jarque Bera Test

data:  pd$PD
X-squared = 9.8774, df = 2, p-value = 0.007164

> jarque.bera.test(lgd$LGDR)

        Jarque Bera Test

data:  lgd$LGDR
X-squared = 0.48156, df = 2, p-value = 0.786

> jarque.bera.test(lgd$LGDE)

        Jarque Bera Test

data:  lgd$LGDE
X-squared = 1.405, df = 2, p-value = 0.4954

Previous6.8. Testovi normalnostiNext6.8.2. Pearsonov hi-kvadrat test normalnosti

Last updated 4 years ago

Was this helpful?