Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 4. Distribucije vjerovatnoća slučajne promjenljive

4.2. Normalni raspored

Normalni raspored predstavlja jedan od najčešće korišćenih rasporeda neprekidnih oblježja u statistici. Za slučajnu promjenljivu kažemo da ima normalan raspored ako je karakterišu neprekidne vrijednosti i ako je njena funkcija gustine definisana kao:

f(x)=1σ2π e−(x−μ)22σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}} \,e^{-\frac{(x-\mu)^2}{2\sigma^2}}f(x)=σ2π​1​e−2σ2(x−μ)2​

gdje je π\piπ konstanta približno jednaka 3.141, eee takođe konstanta približno jednaka 2.718, μ\muμ aritmetička sredina promjenljive i σ\sigmaσ standardna devijacija slučajne promjenljive. Osobine normalnog rasporeda su:

  1. normalna kriva ima oblik zvona i simetrična je u odnosu na aritmetičku sredinu;

  2. aritmetička sredina i medijana međusobno su jednake;

  3. relativna mjera asimetričnosti (skewness) jednaka je 0, dok je relativna mjera spljoštenosti (kurtosis) 3.

Primjer 33: U fajlu PD.csv dati su podaci za vjerovatnoće defaulta (PD) portfolija stanovništva za period od posljednjih 120 mjeseci. Importovati fajl, a zatim izračunati aritmetičku sredinu i standardnu devijaciju PD-ija. Pod pretpostavkom da PD prati normalni raspored, izračunati vjerovatnoću da će ostvareni PD biti:

a) manji od 1.8%; b) veći od 2.7%; c) u intervalu od 2.5% do 3.2%

> #import PD.csv fajla iz radnog direktorijuma (getwd() za provjeru radnog direktorijuma)
> db <- read.csv("PD.csv", header = TRUE)
> #aritmeticka sredina i standardna devijacija PD-ija
> as.pd <- mean(db$PD)
> as.pd
[1] 0.02272998
> sd.pd <- sd(db$PD)
> sd.pd
[1] 0.004715775
> #a) P(PD < 1.8%) za PD iz normalnog rasporeda sa as.pd i sd.pd
> a <- 0.018
> pnorm(q = a, mean = as.pd, sd = sd.pd, lower.tail = TRUE)
[1] 0.1579275
> #b) P(PD > 2.7%) za PD iz normalnog rasporeda sa as.pd i sd.pd
> b <- 0.027
> pnorm(q = b, mean = as.pd, sd = sd.pd, lower.tail = FALSE)
[1] 0.1826066
> #c) P(2.5% < PD < 3.2%) za PD iz normalnog rasporeda sa as.pd i sd.pd
> c1 <- 0.025
> c2 <- 0.032
> cum.prob.c2 <- pnorm(q = c2, mean = as.pd, sd = sd.pd, lower.tail = TRUE)
> cum.prob.c1 <- pnorm(q = c1, mean = as.pd, sd = sd.pd, lower.tail = TRUE)
> cum.prob.c2 - cum.prob.c1
[1] 0.2904637
> #grafik intervala vjerovatnoca
> set.seed(1)
> pn <- rnorm(100e3, mean = as.pd, sd = sd.pd)
> pn.d <- density(pn)
> plot(pn.d, xlab = "PD", ylab = "Funkcija gustine", main = "Funkcija gustine PD")
> abline(h = 0)
> c.region <- seq(c1, c2, by = 0.0001)
> c.d <- dnorm(c.region, mean = as.pd, sd = sd.pd)
> polygon(c(c1, c.region, c2),c(0, c.d, 0), col = "grey")
> text(x = c2, y = mean(pn.d$y), "P(2.5% < PD < 3.2%)", col = "black", cex = 0.8, pos = 4)

Previous4.1. Binomni rasporedNext4.3. Studentov t raspored

Last updated 4 years ago

Was this helpful?