Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 6. Statističko testiranje hipoteza

6.5. Wilcoxonov test ranga na osnovu jednog uzorka

Analogni neparametarski test t-testu na osnovu jednog uzorka jeste Wilcoxonov test ranga, poznat i pod nazivom Mann-Withney-Wilcoxonov test. Postupak primjene Wilcoxonovog testa ranga jeste sljedeći.

  1. Od svake vrijednosti analiziranog obilježja, iz slučajnog uzorka, oduzima se vrijednost testirane vrijednosti i na taj način dobija se niz razlika.

  2. Dobijene razlike rangiraju se po veličini, od najmanje do najveće, zanemarujući predznak i svakoj vrijednosti razlike dodjeljuje se rang.

  3. Svakom rangu dodaje se znak + ili – u zavisnosti od toga da li je originalna vrijednost razlike bila pozitivna ili negativna.

  4. Zatim se izračunava vrijednost Wilcoxonove statistike W+W^{+}W+ , sumiranjem pozitivnih vrijednosti rangova.

  5. Kod velikih uzoraka Wilcoxonova statistika W+W^{+}W+ ima približno normalan raspored sa aritmetičkm sredinom n(n+1)4\frac{n(n+1)}{4}4n(n+1)​ i varijansom n(n+1)(2n+1)24\frac{n(n+1)(2n+1)}{24}24n(n+1)(2n+1)​ obilježja:

Z=W+−n(n+1)4n(n+1)(2n+1)24−∑t(ft3−ft)48Z = \frac{W^{+} - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24} - \frac{\sum_{t}(f_t^3 - f_t)}{48}}}Z=24n(n+1)(2n+1)​−48∑t​(ft3​−ft​)​​W+−4n(n+1)​​

gdje nnn predstavlja broj podataka analiziranog, a ftf_tft​ jeste broj puta ponavljanja nekog ranga.

Dalji postupak zaključivanja o prihvatanju nulte ili alternativne hipoteze isti je kao i kod ostalih testova i donosi se na osnovu poređenja izračunate i teorijske ZZZ vrijednosti ili poređenjem odgovarajućih vrijednosti vjerovatnoće (izračunate p vrijednosti i odabranog nivoa značajnosti).

Primjer 49: U fajlu LGD.csv dati su podaci o realizovanim LGD vrijednostima (kolona LGDR) za 500 kredita stanovništva. Pod pretpostavkom da realizovani LGD ne prati normalni raspored, testirati hipotezu da je prosječno ostvareni LGD veći od regulatornog LGD-ija za isti portfolio, koji iznosi 40%. Koristiti nivo značajnosti od 5%.

> #getwd() za provjeru radnog direktorijuma
> db <- read.csv("LGD.csv", header = TRUE)
> #H0: prosjecni LGDR manji ili jednak od 40%; H1: prosjecni LGDR veci od 40%
> mu <- 0.4
> #nivo znacajnosti 0.05 (5%)
> alpha <- 0.05
> #velicina uzorka
> n <- length(db$LGDR)
> #razlika vrijednosti i testirane vrijednosti
> d <- db$LGDR - mu
> head(d)
[1]  0.04853242  0.08650603  0.26393043 -0.12003077  0.25204286  0.15843336
> #rang
> r <- rank(abs(d))
> head(r)
[1] 101 180 437 244 432 324
> #suma pozitivnih rangova
> w.p <- sum(r[d > 0])
> w.p
[1] 115520
> #standardna greska test statistike
> nties <- table(r)
> head(nties)
r
1 2 3 4 5 6 
1 1 1 1 1 1 
> sigma <- sqrt(n * (n + 1) * (2 * n + 1) / 24 - sum(nties^3 - nties) / 48)
> sigma
[1] 3232.327
> #test statistika
> z <- (w.p - n * (n + 1)/4) / sigma
> z
[1] 16.36437
> #p vrijednost
> p.val <- pnorm(z, lower.tail = FALSE)
> p.val
[1] 1.717772e-60
> p.val < alpha
[1] TRUE
> #r funkcija
> wt.r <- wilcox.test(db$LGDR, mu = mu, alternative = "greater", correct = FALSE)
> wt.r

        Wilcoxon signed rank test

data:  db$LGDR
V = 115520, p-value < 2.2e-16
alternative hypothesis: true location is greater than 0.4

> wt.r$p.val
[1] 1.717772e-60

Previous6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)Next6.6. Wilcoxonov test na osnovu dva uzorka

Last updated 4 years ago

Was this helpful?