Ova vrsta testa koristi se za testiranje hipoteze o aritmetičkoj sredini iz jednog uzorka i taj test može biti jednosmjerni ili dvosmjerni, u zavisnosti od smjera testiranja. t statistika računa se na osnovu sljedeće formule:
t=nsXˉ−μ
gdje Xˉ predstavlja aritmetičku sredinu testiranog obilježja izračunatu na osnovu uzorka, μ vrijednost aritmetičke sredine koju testiramo, s standardnu devijaciju obilježja izračunatu, takođe, na osnovu podataka iz uzorka, i n veličinu uzorka.
Primjer 40: U fajlu LGD.csv dati su podaci o realizovanim LGD vrijednostima (kolona LGDR) za 500 kredita stanovništva. Pod pretpostavkom da realizovani LGD prati normalni raspored, testirati hipotezu da je prosječni ostvareni LGD veći od regulatornog LGD-ija za isti portfolio, koji iznosi 40%. Koristiti nivo značajnosti od 5%.
> #getwd() za provjeru radnog direktorijuma
> db <- read.csv("LGD.csv", header = TRUE)
> #H0: prosjecni LGDR manji ili jednak od 40%; H1: prosjecni prosjecni LGDR veci od 40%
> mu <- 0.4
> #nivo znacajnosti 0.05 (5%)
> alpha <- 0.05
> #velicina uzorka n
> n <- length(db$LGDR)
> n
[1] 500
> #aritmeticka sredina ostvarenog LGD-ija
> xbar <- mean(db$LGDR)
> xbar
[1] 0.5174322
> #standardna greska aritmeticke sredine
> se <- sd(db$LGDR) / sqrt(n)
> se
[1] 0.005256987
> #t statistika (te - empirijska t vrijednost)
> te <- (xbar - mu) / se
> te
[1] 22.33831
> #teorijska vrijednost t statistike za odabrani nivo znacajnosti alpha
> tt <- qt(alpha, n - 1, lower.tail = FALSE)
> tt
[1] 1.647913
> #odluka, ukoliko je te < tt ne mozemo odbaciti H0
> te > tt
[1] TRUE
> #odluka na osnovu p vrijednosti: ukoliko je p < alpha prihvatamo H1
> p <- pt(te, n - 1, lower.tail = FALSE)
> p
[1] 1.969194e-77
> p < alpha
[1] TRUE
> #koristeci postojecu funkciju t.test
> tt.r <- t.test(db$LGDR, alternative = "greater", mu = mu)
> tt.r
One Sample t-test
data: db$LGDR
t = 22.338, df = 499, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0.4
95 percent confidence interval:
0.5087692 Inf
sample estimates:
mean of x
0.5174322
> tt.r$p.val
[1] 1.969194e-77
Primjer 41: Za podatke iz Primjera 40 testirati još dvije hipoteze i to:
da je prosječni realizovani LGD manji od 53%;
da je prosječni realizovani LGD različit od 51%.
> #H1: prosjecni prosjecni LGDR manji od 53%
> mu.1 <- 0.53
> alpha <- 0.05
> n <- length(db$LGDR)
> tt.1 <- t.test(db$LGDR, alternative = "less", mu = mu.1)
> tt.1
One Sample t-test
data: db$LGDR
t = -2.3907, df = 499, p-value = 0.008593
alternative hypothesis: true mean is less than 0.53
95 percent confidence interval:
-Inf 0.5260953
sample estimates:
mean of x
0.5174322
> tt.1$p.val
[1] 0.008593453
> tt.1$p.val < alpha
[1] TRUE
> te.1 <- (mean(db$LGDR) - mu.1) / (sd(db$LGDR) / sqrt(n))
> te.1
[1] -2.390681
> pt(te.1, n - 1, lower.tail = TRUE)
[1] 0.008593453
> #H1: prosjecni prosjecni LGDR razlicit od 51%
> mu.2 <- 0.51
> tt.2 <- t.test(db$LGDR, alternative = "two.sided", mu = mu.2)
> tt.2
One Sample t-test
data: db$LGDR
t = 1.4138, df = 499, p-value = 0.1581
alternative hypothesis: true mean is not equal to 0.51
95 percent confidence interval:
0.5071037 0.5277608
sample estimates:
mean of x
0.5174322
> tt.2$p.val
[1] 0.1580502
> tt.2$p.val < alpha
[1] FALSE
> te.2 <- (mean(db$LGDR) - mu.2) / (sd(db$LGDR) / sqrt(n))
> te.2
[1] 1.41378
> 2 * pt(-abs(te.2), n - 1, lower.tail = TRUE)
[1] 0.1580502