Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 6. Statističko testiranje hipoteza

6.2. t-test na osnovu dva uzorka

Previous6.1. t-test na osnovu jednog uzorkaNext6.3. Test proporcija

Last updated 4 years ago

Was this helpful?

U zavisnosti od toga da li su vrijednosti obilježja iz dva uzorka nezavisne ili ne, razlikujemo nezavisni i upareni t-test. Kod nezavisnog t-testa, pretpostavka je da vrijednosti obilježja uzoraka dolaze iz dvije nezavisne populacije, a obično i veličina uzoraka je različita. Na osnovu vrijednosti iz takva dva uzorka možemo testirati hipotezu o jednakosti ili nejednakosti aritmetičkih sredina obilježja. t statistika nezavisnog test iz dva uzorka dobija se na osnovu izraza:

t=Xaˉ−Xbˉvana+vbnbt = \frac{\bar{X_a} - \bar{X_b}}{\sqrt{\frac{v_a}{n_a}+\frac{v_b}{n_b}}}t=na​va​​+nb​vb​​​Xa​ˉ​−Xb​ˉ​​

gdje su Xaˉ\bar{X_a}Xa​ˉ​ i Xbˉ\bar{X_b}Xb​ˉ​ aritmetičke sredine uzoraka aaa i bbb, vav_ava​ i vbv_bvb​ varijanse, dok nan_ana​ i nbn_bnb​ predstavljaju veličine uzoraka. Za razliku od nezavisnog t-testa, upareni t-test podrazumijeva da vrijednosti uzoraka dolaze iz iste populacije odnosno da su korelisane. U suštini, upareni t-test podrazumijeva prikupljanje vrijednosti obilježja istih jedinica uzorka u dva različita vremenska perioda. t statistika uparenog testa računa se kao:

t=dˉsdnt = \frac{\bar{d}}{\frac{s_d}{\sqrt{n}}}t=n​sd​​dˉ​

gdje dˉ\bar{d}dˉ predstavlja aritmetičku sredinu razlike vrijednosti uparenih uzoraka, sds_dsd​ standardnu devijaciju te razlike, a nnn broj podataka.

Primjer 42: Fajl LGD.csv sadrži podatke o ocijenjenim (modelskim) LGD vrijednostima (kolona LGDE) i realizovanim LGD vrijednostima za 500 kredita. Pod pretpostavkom da LGD vrijednosti prate normalni rasprored, testirati da li je prosječni ostvareni LGD veći od prosječnog ocijenjenog LGD-ija. Koristiti nivo značajnosti od 5%.

> x1 <- db$LGDR 
> x2 <- db$LGDE
> #H1: prosjecni realizovani LGD-ija > prosjecnog ocijenjenog LGD-ija
> alpha <- 0.05
> d <- x1 - x2
> n <- length(d)
> t.stat <- mean(d) / (sd(d) / sqrt(n))
> t.stat 
[1] 31.37349
> p.val <- pt(t.stat, n - 1, lower.tail = FALSE)
> p.val
[1] 1.972374e-120
> p.val < alpha
[1] TRUE
> #t.test funkcija
> tt.r <- t.test(x = x1, y = x2, alternative = "greater", paired = TRUE)
> tt.r

        Paired t-test

data:  x1 and x2
t = 31.373, df = 499, p-value < 2.2e-16
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
 0.06371608        Inf
sample estimates:
mean of the differences 
             0.06724834 

> tt.r$p.val
[1] 1.972374e-120