Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

  1. 4. Distribucije vjerovatnoća slučajne promjenljive

4.1. Binomni raspored

Binomni raspored predstavlja raspored prekidnih obilježja i koristi se kada slučajna promjenljiva može da uzme jednu od dvije moguće vrijednosti, koje su međusobno isključive. Obično se ovi ishodi označavaju kao uspjeh i neuspjeh (primjeri: modeli vjerovatnoće defaulta, PD - dobar/loš, churn modeli - ostaje/ napušta, modeli prijevremene otplate - otplaćuje prije vremena/redovno otplaćuje…). Binomni raspored u potpunosti je određen brojem pokušaja (n) i vjerovatnoćom uspjeha, tj. uspješnog ishoda (p). Funkcija vjerovatnoće binomnog rasporeda definisana je sljedećom formulom:

P(Y=j)=(nj)pj(1−pj)n−jP(Y = j) = \begin {pmatrix} n \\ j \end {pmatrix} p^j(1-p^j)^{n-j}P(Y=j)=(nj​)pj(1−pj)n−j

gdje:

(nj)=n!j!(n−j)!\begin {pmatrix} n \\ j \end {pmatrix} = \frac{n!}{j!(n-j)!}(nj​)=j!(n−j)!n!​

predstavalja binomni koeficijent, nnn broj pokušaja, jjj vrijednost za koji računamo vjerovatnoću i ppp vjerovatnoću uspjeha.

Primjer 29: Na osnovu istorijskih podataka o razvoju portfolija u posljednjih 10 godina, izračunata je prosječna vjerovatnoća defaulta (PD) od 2.5%. Kolika je vjerovatnoća da će od narednih 1000 novoodobrenih kredita defaultnih biti između 20 i 40, ukoliko se prosječni PD smatra stvarnim?

> #P(20 < X < 40) za X iz binomne distribucije sa parametrima n = 1000 i p = 2.5% (pd)
> pd <- 0.025
> n <- 1000
> d <- c(20, 40)
> sum(dbinom(x = c(d[1] + 1):c(d[2] + 1), size = n, prob = pd))
[1] 0.8167772 

Primjer 30: Za PD iz Primjera 26 izračunati vjerovatnoću da će od narednih 1000 novoodobrenih kredita defaultnih biti manje od 25, ukoliko se prosječni PD smatra stvarnim.

> #P(X < 25) za X iz binomne distribucije sa parametrima n = 1000 i p = 2.5% (pd)
> pd <- 0.025
> n <- 1000
> d <- 25
> pbinom(q = d - 1, size = n, prob = pd, lower.tail = TRUE)
[1] 0.4723898 

Primjer 31: Za PD iz Primjera 26 izračunati vjerovatnoću da će od narednih 1000 novoodobrenih kredita, defaultnih biti 40 ili više, ukoliko se prosječni PD smatra stvarnim.

> #P(X >= 40) za X iz binomne distribucije sa parametrima n = 1000 i p = 2.5% (pd)
> pd <- 0.025
> n <- 1000
> d <- 40
> pbinom(q = d, size = n, prob = pd, lower.tail = FALSE)
[1] 0.001781078

Pored vjerovatnoća nekog kvantila, možemo računati i vrijednosti (kvantile) za zadatu vjerovatnoću koristeći funkciju qbinom , koja je inverzna funkcija funkcije pbinom.

Primjer 32: Dat je prosječni PD od 2.5%. Pod pretpostavkom da PD prati binomni raspored, za 1000 novoodobrenih kredita koji je maksimalni broj default iznad kojeg postoji svega 10% vjerovatnoće da će ostvareni PD biti veći od prosječnog?

> pd <- 0.025
> n <- 1000
> p <- 0.1
> broj.defaulta <- qbinom(p = p, size = n, prob = pd, lower.tail = FALSE)
> broj.defaulta
[1] 31
> #provjera - funkcija kumilativne vjerovatnoce
> pbinom(q = broj.defaulta, size = n, prob = pd, lower.tail = FALSE)
[1] 0.09729042
> #provjera - simulacija
> set.seed(321)
> rb <- rbinom(n = 10e3, size = n, prob = pd)
> sum(rb > broj.defaulta) / length(rb)
[1] 0.0975
> #grafik
> pb <- dbinom(rb, size = n, p = pd)
> plot(rb, pb, type = "h" , xlab = "Moguce vrijednosti - broj default", ylab = "Vjerovatnoca ostvarenja",
+ main = paste0("Binomni raspored n = ",  n, " p = ", paste0(pd * 100, "%")), col = "red") 

Previous4. Distribucije vjerovatnoća slučajne promjenljiveNext4.2. Normalni raspored

Last updated 4 years ago

Was this helpful?