Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 6. Statističko testiranje hipoteza

6.1. t-test na osnovu jednog uzorka

Ova vrsta testa koristi se za testiranje hipoteze o aritmetičkoj sredini iz jednog uzorka i taj test može biti jednosmjerni ili dvosmjerni, u zavisnosti od smjera testiranja. t statistika računa se na osnovu sljedeće formule:

t=Xˉ−μsnt = \frac{\bar{X} - \mu}{\frac{s}{\sqrt{n}}}t=n​s​Xˉ−μ​

gdje Xˉ\bar{X}Xˉ predstavlja aritmetičku sredinu testiranog obilježja izračunatu na osnovu uzorka, μ\muμ vrijednost aritmetičke sredine koju testiramo, sss standardnu devijaciju obilježja izračunatu, takođe, na osnovu podataka iz uzorka, i nnn veličinu uzorka.

Primjer 40: U fajlu LGD.csv dati su podaci o realizovanim LGD vrijednostima (kolona LGDR) za 500 kredita stanovništva. Pod pretpostavkom da realizovani LGD prati normalni raspored, testirati hipotezu da je prosječni ostvareni LGD veći od regulatornog LGD-ija za isti portfolio, koji iznosi 40%. Koristiti nivo značajnosti od 5%.

> #getwd() za provjeru radnog direktorijuma
> db <- read.csv("LGD.csv", header = TRUE)
> #H0: prosjecni LGDR manji ili jednak od 40%; H1: prosjecni prosjecni LGDR veci od 40%
> mu <- 0.4
> #nivo znacajnosti 0.05 (5%)
> alpha <- 0.05
> #velicina uzorka n
> n <- length(db$LGDR)
> n
[1] 500
> #aritmeticka sredina ostvarenog LGD-ija
> xbar <- mean(db$LGDR)
> xbar
[1] 0.5174322
> #standardna greska aritmeticke sredine
> se <- sd(db$LGDR) / sqrt(n)
> se
[1] 0.005256987
> #t statistika (te - empirijska t vrijednost)
> te <- (xbar - mu) / se
> te
[1] 22.33831
> #teorijska vrijednost t statistike za odabrani nivo znacajnosti alpha
> tt <- qt(alpha, n - 1, lower.tail = FALSE)
> tt
[1] 1.647913
> #odluka, ukoliko je te < tt ne mozemo odbaciti H0
> te > tt
[1] TRUE
> #odluka na osnovu p vrijednosti: ukoliko je p < alpha prihvatamo H1
> p <- pt(te, n - 1, lower.tail = FALSE)
> p
[1] 1.969194e-77
> p < alpha
[1] TRUE
> #koristeci postojecu funkciju t.test
> tt.r <- t.test(db$LGDR, alternative = "greater", mu = mu)
> tt.r

        One Sample t-test

data:  db$LGDR
t = 22.338, df = 499, p-value < 2.2e-16
alternative hypothesis: true mean is greater than 0.4
95 percent confidence interval:
 0.5087692       Inf
sample estimates:
mean of x 
0.5174322 

> tt.r$p.val
[1] 1.969194e-77 

Primjer 41: Za podatke iz Primjera 40 testirati još dvije hipoteze i to:

  1. da je prosječni realizovani LGD manji od 53%;

  2. da je prosječni realizovani LGD različit od 51%.

> #H1: prosjecni prosjecni LGDR manji od 53%
> mu.1 <- 0.53
> alpha <- 0.05
> n <- length(db$LGDR)
> tt.1 <- t.test(db$LGDR, alternative = "less", mu = mu.1)
> tt.1

        One Sample t-test

data:  db$LGDR
t = -2.3907, df = 499, p-value = 0.008593
alternative hypothesis: true mean is less than 0.53
95 percent confidence interval:
      -Inf 0.5260953
sample estimates:
mean of x 
0.5174322 

> tt.1$p.val
[1] 0.008593453
> tt.1$p.val < alpha
[1] TRUE
> te.1 <- (mean(db$LGDR) - mu.1) / (sd(db$LGDR) / sqrt(n))
> te.1
[1] -2.390681
> pt(te.1, n - 1, lower.tail = TRUE)
[1] 0.008593453
> #H1: prosjecni prosjecni LGDR razlicit od 51%
> mu.2 <- 0.51
> tt.2 <- t.test(db$LGDR, alternative = "two.sided", mu = mu.2)
> tt.2

        One Sample t-test

data:  db$LGDR
t = 1.4138, df = 499, p-value = 0.1581
alternative hypothesis: true mean is not equal to 0.51
95 percent confidence interval:
 0.5071037 0.5277608
sample estimates:
mean of x 
0.5174322 
> tt.2$p.val
[1] 0.1580502
> tt.2$p.val < alpha
[1] FALSE
> te.2 <- (mean(db$LGDR) - mu.2) / (sd(db$LGDR) / sqrt(n))
> te.2
[1] 1.41378
> 2 * pt(-abs(te.2), n - 1, lower.tail = TRUE)
[1] 0.1580502

Previous6. Statističko testiranje hipotezaNext6.2. t-test na osnovu dva uzorka

Last updated 4 years ago

Was this helpful?