6.5. Wilcoxonov test ranga na osnovu jednog uzorka

Analogni neparametarski test t-testu na osnovu jednog uzorka jeste Wilcoxonov test ranga, poznat i pod nazivom Mann-Withney-Wilcoxonov test. Postupak primjene Wilcoxonovog testa ranga jeste sljedeći.

Od svake vrijednosti analiziranog obilježja, iz slučajnog uzorka, oduzima se vrijednost testirane vrijednosti i na taj način dobija se niz razlika.
Dobijene razlike rangiraju se po veličini, od najmanje do najveće, zanemarujući predznak i svakoj vrijednosti razlike dodjeljuje se rang.
Svakom rangu dodaje se znak + ili – u zavisnosti od toga da li je originalna vrijednost razlike bila pozitivna ili negativna.
Zatim se izračunava vrijednost Wilcoxonove statistike $W^{+}$ , sumiranjem pozitivnih vrijednosti rangova.
Kod velikih uzoraka Wilcoxonova statistika $W^{+}$ ima približno normalan raspored sa aritmetičkm sredinom $\frac{n(n+1)}{4}$ i varijansom $\frac{n(n+1)(2n+1)}{24}$ obilježja:

Z = \frac{W^{+} - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24} - \frac{\sum_{t}(f_t^3 - f_t)}{48}}}

gdje $n$ predstavlja broj podataka analiziranog, a $f_t$ jeste broj puta ponavljanja nekog ranga.

Dalji postupak zaključivanja o prihvatanju nulte ili alternativne hipoteze isti je kao i kod ostalih testova i donosi se na osnovu poređenja izračunate i teorijske $Z$ vrijednosti ili poređenjem odgovarajućih vrijednosti vjerovatnoće (izračunate p vrijednosti i odabranog nivoa značajnosti).

Primjer 49: U fajlu LGD.csv dati su podaci o realizovanim LGD vrijednostima (kolona LGDR) za 500 kredita stanovništva. Pod pretpostavkom da realizovani LGD ne prati normalni raspored, testirati hipotezu da je prosječno ostvareni LGD veći od regulatornog LGD-ija za isti portfolio, koji iznosi 40%. Koristiti nivo značajnosti od 5%.

> #getwd() za provjeru radnog direktorijuma
> db <- read.csv("LGD.csv", header = TRUE)
> #H0: prosjecni LGDR manji ili jednak od 40%; H1: prosjecni LGDR veci od 40%
> mu <- 0.4
> #nivo znacajnosti 0.05 (5%)
> alpha <- 0.05
> #velicina uzorka
> n <- length(db$LGDR)
> #razlika vrijednosti i testirane vrijednosti
> d <- db$LGDR - mu
> head(d)
[1]  0.04853242  0.08650603  0.26393043 -0.12003077  0.25204286  0.15843336
> #rang
> r <- rank(abs(d))
> head(r)
[1] 101 180 437 244 432 324
> #suma pozitivnih rangova
> w.p <- sum(r[d > 0])
> w.p
[1] 115520
> #standardna greska test statistike
> nties <- table(r)
> head(nties)
r
1 2 3 4 5 6 
1 1 1 1 1 1 
> sigma <- sqrt(n * (n + 1) * (2 * n + 1) / 24 - sum(nties^3 - nties) / 48)
> sigma
[1] 3232.327
> #test statistika
> z <- (w.p - n * (n + 1)/4) / sigma
> z
[1] 16.36437
> #p vrijednost
> p.val <- pnorm(z, lower.tail = FALSE)
> p.val
[1] 1.717772e-60
> p.val < alpha
[1] TRUE
> #r funkcija
> wt.r <- wilcox.test(db$LGDR, mu = mu, alternative = "greater", correct = FALSE)
> wt.r

        Wilcoxon signed rank test

data:  db$LGDR
V = 115520, p-value < 2.2e-16
alternative hypothesis: true location is greater than 0.4

> wt.r$p.val
[1] 1.717772e-60

Previous6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)Next6.6. Wilcoxonov test na osnovu dva uzorka

Last updated 4 years ago

Was this helpful?