6.5. Wilcoxonov test ranga na osnovu jednog uzorka
Analogni neparametarski test t-testu na osnovu jednog uzorka jeste Wilcoxonov test ranga, poznat i pod nazivom Mann-Withney-Wilcoxonov test. Postupak primjene Wilcoxonovog testa ranga jeste sljedeći.
Od svake vrijednosti analiziranog obilježja, iz slučajnog uzorka, oduzima se vrijednost testirane vrijednosti i na taj način dobija se niz razlika.
Dobijene razlike rangiraju se po veličini, od najmanje do najveće, zanemarujući predznak i svakoj vrijednosti razlike dodjeljuje se rang.
Svakom rangu dodaje se znak + ili – u zavisnosti od toga da li je originalna vrijednost razlike bila pozitivna ili negativna.
Zatim se izračunava vrijednost Wilcoxonove statistike , sumiranjem pozitivnih vrijednosti rangova.
Kod velikih uzoraka Wilcoxonova statistika ima približno normalan raspored sa aritmetičkm sredinom i varijansom obilježja:
gdje predstavlja broj podataka analiziranog, a jeste broj puta ponavljanja nekog ranga.
Dalji postupak zaključivanja o prihvatanju nulte ili alternativne hipoteze isti je kao i kod ostalih testova i donosi se na osnovu poređenja izračunate i teorijske vrijednosti ili poređenjem odgovarajućih vrijednosti vjerovatnoće (izračunate p vrijednosti i odabranog nivoa značajnosti).
Primjer 49: U fajlu LGD.csv dati su podaci o realizovanim LGD vrijednostima (kolona LGDR) za 500 kredita stanovništva. Pod pretpostavkom da realizovani LGD ne prati normalni raspored, testirati hipotezu da je prosječno ostvareni LGD veći od regulatornog LGD-ija za isti portfolio, koji iznosi 40%. Koristiti nivo značajnosti od 5%.
> #getwd() za provjeru radnog direktorijuma
> db <- read.csv("LGD.csv", header = TRUE)
> #H0: prosjecni LGDR manji ili jednak od 40%; H1: prosjecni LGDR veci od 40%
> mu <- 0.4
> #nivo znacajnosti 0.05 (5%)
> alpha <- 0.05
> #velicina uzorka
> n <- length(db$LGDR)
> #razlika vrijednosti i testirane vrijednosti
> d <- db$LGDR - mu
> head(d)
[1] 0.04853242 0.08650603 0.26393043 -0.12003077 0.25204286 0.15843336
> #rang
> r <- rank(abs(d))
> head(r)
[1] 101 180 437 244 432 324
> #suma pozitivnih rangova
> w.p <- sum(r[d > 0])
> w.p
[1] 115520
> #standardna greska test statistike
> nties <- table(r)
> head(nties)
r
1 2 3 4 5 6
1 1 1 1 1 1
> sigma <- sqrt(n * (n + 1) * (2 * n + 1) / 24 - sum(nties^3 - nties) / 48)
> sigma
[1] 3232.327
> #test statistika
> z <- (w.p - n * (n + 1)/4) / sigma
> z
[1] 16.36437
> #p vrijednost
> p.val <- pnorm(z, lower.tail = FALSE)
> p.val
[1] 1.717772e-60
> p.val < alpha
[1] TRUE
> #r funkcija
> wt.r <- wilcox.test(db$LGDR, mu = mu, alternative = "greater", correct = FALSE)
> wt.r
Wilcoxon signed rank test
data: db$LGDR
V = 115520, p-value < 2.2e-16
alternative hypothesis: true location is greater than 0.4
> wt.r$p.val
[1] 1.717772e-60
Last updated
Was this helpful?