Test proporcija je jedan od najčešće korišćenih testova u statističkom testiranju hipoteza. Ovo prosto iz razloga što dosta obilježja ima formu proporcije (učešće određene vrijednosti u ukupnoj populaciji). Test proporcija može biti test na osnovu jednog ili dva uzorka, isto kao i t-test. Test statistika na osnovu jednog uzorka računa se po sljedećoj formuli:
Z1=np0(1−p0)p^−p0
gdje p^ predstavlja proporciju na osnovu uzorka, p0 test proporciju, dok n predstavlja broj testiranih podataka.
Test statistika testa proporcije na osnovu dva uzorka računa se kao:
Pretpostavka za obje test statistike ( Z1,Z2 ) jeste da mogu biti aproksimirane standardnim normalnim rasporedom (aritmetička sredina 0 i standardna devijacija 1), pa se na osnovu tog rasporeda i utvrđuju teorijske vrijednosti testa i vjerovatnoća.
Test proporcija naročito je primjenljiv u validaciji PD modela u kojoj se obično testira da li je ostvareni PD manji od modeliranog PD-ija ili je jednak sa njima, kao i za testiranje heterogenosti PD rejting skale.
Primjer 43: Simulirati 1000 vrijednosti iz binomne distribucije, sa vjerovatnoćom uspjeha od 5%. Vrijednosti jednake jedinici predstavljaju simulirane loše kredite (default), dok vrijednosti jedake nule predstavljaju dobre kredite (non-default). Koristeći test proporcije i za nivo značajnosti od 5%, testirati da li je stopa defaulta iz uzorka:
različita od 5%;
manja od 6%;
veća od 5%.
> set.seed(1990)
> pd <- 0.05
> n <- 1e3
> alpha <- 0.05
> default <- rbinom(n = n, size = 1, prob = pd)
> dr <- sum(default == 1) / length(default)
> dr
[1] 0.051
> #1. H1: dr razlicit od 5%
> t.stat.1 <- (dr - 0.05) / sqrt((0.05 * (1 - 0.05) / n))
> p.val1 <- 2 * pnorm(-abs(t.stat.1), lower.tail = TRUE)
> p.val1
[1] 0.8846357
> p.val1 < alpha
[1] FALSE
> prop.t.1 <- prop.test(x = sum(default == 1), n = n, p = 0.05, alternative = "two.sided", correct = FALSE)
> prop.t.1
1-sample proportions test without continuity correction
data: sum(default == 1) out of n, null probability 0.05
X-squared = 0.021053, df = 1, p-value = 0.8846
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
0.03900094 0.06643549
sample estimates:
p
0.051
> prop.t.1$p.val
[1] 0.8846357
> #2. H1: dr manji od 6%
> t.stat.2 <- (dr - 0.06) / sqrt((0.06 * (1 - 0.06) / n))
> p.val2 <- pnorm(t.stat.2, lower.tail = TRUE)
> p.val2
[1] 0.11538
> p.val2 < alpha
[1] FALSE
> prop.t.2 <- prop.test(x = sum(default == 1), n = n, p = 0.06, alternative = "less", correct = FALSE)
> prop.t.2
1-sample proportions test without continuity correction
data: sum(default == 1) out of n, null probability 0.06
X-squared = 1.4362, df = 1, p-value = 0.1154
alternative hypothesis: true p is less than 0.06
95 percent confidence interval:
0.00000000 0.06370325
sample estimates:
p
0.051
> prop.t.2$p.val
[1] 0.11538
> #3. H1: dr veci od 5%
> t.stat.3 <- (dr - 0.05) / sqrt((0.05 * (1 - 0.05) / n))
> p.val3 <- pnorm(t.stat.3, lower.tail = FALSE)
> p.val3
[1] 0.4423178
> p.val3 < alpha
[1] FALSE
> prop.t.3 <- prop.test(x = sum(default == 1), n = n, p = 0.05, alternative = "greater", correct = FALSE)
> prop.t.3
1-sample proportions test without continuity correction
data: sum(default == 1) out of n, null probability 0.05
X-squared = 0.021053, df = 1, p-value = 0.4423
alternative hypothesis: true p is greater than 0.05
95 percent confidence interval:
0.04071977 1.00000000
sample estimates:
p
0.051
> prop.t.3$p.val
[1] 0.4423178
Primjer 44: Simulirati ostvarene stope defaultaa za dvije rejting klase iz binomnog rasporeda i to sa sljedećim karakteristikama:
a) rejting klasa 1 (rc1) – 500 klijenata i vjerovatnoća defaulta 2.5%;
b) rejting klasa 2 (rc2) – 350 klijenata i vjerovatnoća defaulta 4%.
Testirati hipotezu da je stopa defaulta rejting klase 2 veća od stope defaulta rejting klase 1.