6.9.2. Bartlettov test homogenosti varijansi

U slučaju postojanja više od dva uzorka, za ispitivanje homogenosti varijansi može se primijeniti Bartlettov test. Pretpostavke ovog testa iste su kao i za F test: normalnost i nezavisnost uzoraka. Test statistika je data sljedećom formulom:

T=(nk)ln(sp2)i=1k(ni1)ln(si2)1+13(k1)i=1k1ni11nkT = \frac{(n-k)ln(s_p^2) - \sum_{i=1}^{k}(n_i-1)ln(s_i^2)}{1 + \frac{1}{3(k-1)}\sum_{i=1}^{k}\frac{1}{n_i-1} - \frac{1}{n-k}}

gdje nn predstavlja ukupan broj opservacija, nin_i broj opservacija u ii-tom uzorku, kk broj uzoraka, si2s_i^2 varijansu analiziranog obilježja u ii-tom uzorku, dok je sp2s_p^2 dat izrazom:

sp2=i=1k(niki)si2nks_p^2 = \sum_{i=1}^{k}\frac{(n_i-k_i)s_i^2}{n-k}

Izračunata test statistika prati hi-kvadrt raspored sa k1k - 1 stepeni slobode.

Primjer 56: Za podatke o realizovanom LGD-iju (kolona LGDR, fajl LGD.csv), pod pretpostavkom normalnosti i koristeći Bartlettov test, testirati jednakost varijansi segmenata (kolona segment.e). Koristiti nivo značajnosti od 5%.

> #nivo znacajnosti
> alpha <- 0.05
> #broj opservacija
> n <- length(lgd$LGDR)
> n
[1] 500
> #broj uzoraka
> k <- length(unique(lgd$segment.e))
> k
[1] 4
> #broj opservacija u uzorcima
> ni <- tapply(lgd$LGDR, lgd$segment.e, length)
> ni
segment1 segment2 segment3 segment4 
      41      233      197       29 
> #varijansa unutar uzoraka
> si <- tapply(lgd$LGDR, lgd$segment.e, var)
> si
   segment1    segment2    segment3    segment4 
0.001885841 0.002237075 0.002429202 0.002409014 
> #test statistika
> sp <- sum((ni - 1) * si / (n - k))
> sp
[1] 0.002294377
> test.stat <- ((n - k) * log(sp) - sum((ni - 1) * log(si))) /  (1 + (sum(1 / (ni - 1)) - 1 / (n - k)) / (3 * (k - 1)))
> test.stat 
[1] 1.145558
> #p vrijednost
> p.val <- pchisq(test.stat, k - 1, lower.tail = FALSE)
> p.val
[1] 0.7660892
> p.val < alpha
[1] FALSE
> #r funkcija
> bt.r <- bartlett.test(x = lgd$LGDR, g = lgd$segment.e)
> bt.r

        Bartlett test of homogeneity of variances

data:  lgd$LGDR and lgd$segment.e
Bartlett's K-squared = 1.1456, df = 3, p-value = 0.7661

> bt.r$p.val
[1] 0.7660892

Last updated

Was this helpful?