Primijenjena statistika
  • Priručnik primijenjene statistike u R-u
  • Predgovor
  • 1. Uvod u R
    • 1.1. R objekti
    • 1.2. Manipulacije i agregacije podataka
    • 1.3. Import i eksport podataka
    • 1.4. Korisničke funkcije
  • 2. Tipovi i nivoi mjerenja statističkih obilježja
  • 3. Deskriptivna statistika i grafičko predstavljanje podataka
    • 3.1. Mjere centralne tendencije
    • 3.2. Mjere varijabiliteta
    • 3.3. Mjere oblika rasporeda
    • 3.4. Grafičko predstavljanje podataka
  • 4. Distribucije vjerovatnoća slučajne promjenljive
    • 4.1. Binomni raspored
    • 4.2. Normalni raspored
    • 4.3. Studentov t raspored
    • 4.4. Fišerov F raspored i hi-kvadrat raspored
  • 5. Uzorak i uzoračke ocjene
  • 6. Statističko testiranje hipoteza
    • 6.1. t-test na osnovu jednog uzorka
    • 6.2. t-test na osnovu dva uzorka
    • 6.3. Test proporcija
    • 6.4. Analiza varijanse – ANOVA (klasična ANOVA i Welch ANOVA)
    • 6.5. Wilcoxonov test ranga na osnovu jednog uzorka
    • 6.6. Wilcoxonov test na osnovu dva uzorka
    • 6.7. Kruskal-Wallisov test
    • 6.8. Testovi normalnosti
      • 6.8.1. Jarque-Bera test normalnosti
      • 6.8.2. Pearsonov hi-kvadrat test normalnosti
    • 6.9. Testovi homogenosti varijanse
      • 6.9.1. F test jednakosti varijansi
      • 6.9.2. Bartlettov test homogenosti varijansi
      • 6.9.3. Fligner-Killeenov test homogenosti varijansi
  • 7. Linearna regresija
    • 7.1. Ocjena modela linearne regresije
    • 7.2. Dijagnostika ocijenjenog modela linearne regresije
  • 8. Binomna logistička regresija
  • 9. Literatura
  • Biografija
Powered by GitBook
On this page

Was this helpful?

2. Tipovi i nivoi mjerenja statističkih obilježja

Dva osnovna tipa statističkih obilježja (slučajnih promjenljivih, varijabli) jesu kvalitativna i kvantitativna obilježja. Ukoliko je ispitivana pojava nenumerička, onda se radi o kvalitativnom obilježju. Brojni su primjeri kvalitativnih obilježja: pol, region, bračni status… Nasuprot kvalitativnom obilježju, ukoliko se ispitivano obilježje može tačno numerički predstaviti (godine starosti, iznos kredita, BDP, stopa nezaposlenosti, zarada, kamatna stopa…), onda se radi o kvantitativnom tipu obilježja. Najčešće ispitivanje statističkih pojava podrazumijeva kombinaciju kvalitativnih i kvantitativnih obilježja.

Još jedna podjela obilježja, koja je usko povezana sa prethodno navedenim tipovima obilježja, jeste podjela na prekidna i neprekidna obilježja. Prekidna obilježja predstavljaju sva obilježja koja sadrže prebrojivo mnogo vrijednosti, dok neprekidna obilježja predstavljaju sva obilježja koja imaju neprebrojivo mnogo vrijednosti. Primjer prekidnog obilježja bio bi broj odobrenih kredita u nekom mjesecu, dok bi neprekidno obilježje bio odobreni iznos kredita ili kamatna stopa.

Obilježja mogu biti klasifikovana i u zavisnosti od nivoa mjerenja.

Nominalni nivo mjerenja imaju ona kvalitativna obilježja koja se mogu samo klasifikovati i prebrojati i za koja ne postoji standardizovano pravilo rangiranja. Primjer nominalnog nivos mjerenja jeste pol. Pol osobe može biti klasifikovan i prebrojan, ali ne postoji pravilo po kome se vrijednosti mogu rangirati odnoso reći da je osoba ženskog pola ‘bolja’ od osobe muškog.

Ordinalni nivo mjerenja predstavlja sljedeći i viši nivo mjerenja od nominalnog. Za razliku od nominalnog nivoa mjerenja, kod ordinalnog nivoa obilježja mogu biti rangirana po nekom standardizovom pravilu. Primjer ordinalnog nivoa mjerenja mogu biti grupe dana kašnjenja klijenata banke: od 0 do 30 dana, od 31 do 90 dana, 91 i više dana. Nedostatak ordinalnog nivoa mjerenja jeste taj što, i pored toga što grupe obilježja mogu biti rangirane, razlike između grupa obilježja ne mogu biti kvantifikovane, odnosno ne možemo utvrditi za koliko jedinica je neka grupa ‘bolja‘ od druge (za koliko su klijenti koji pripadaju grupi od 0 do 30 dana kašnjenja bolji od klijenata iz grupe 91 i više dana).

Obilježja koja pored toga što njihove grupe mogu biti rangirane posjeduju i karakteristiku da se razlika između grupa može kvantifikovati, imaju intervalni nivo mjerenja. Primjer intervalnog nivoa mjerenja može biti kamatna stopa.

Najveći nivo mjerenja nekog obilježja jeste racio nivo. Ovaj nivo mjerenja ima sve karakteristike kao i intervalni nivo, uključujući i postojanje prirodne nule kao početne tačke. Naime, količnik dvije vrijednosti obilježja intervalnog nivoa mjerenja nema značenje, tj. ne možemo reći da je kamatna stopa od 1% tri puta veća nego kamatna stopa od -3%. Razlog ovome je što intervalni nivo mjerenja ne sadrži prirodnu nulu kao početnu tačku mjerenja (0% kamatna stopa nije najniža moguća vrijednost). Primjer racio nivoa mjerenja može biti iznos odobrenog kredita. Ako je prva vrijednost obilježja 1000 eura, a druga 3000 eura, količnik ove dvije vrijednosti je smislen, odnosno može se reći da je druga vrijednost obilježja tri puta veća od prve vrijednosti obilježja. Može se primijetiti da iznos kredita kao ispitivano obilježje sadrži prirodnu nulu kao početnu tačku.

Razumijevanje tipa i novoa mjerenja ispitivanog obilježja od izuzetnog je značaja za odabir odgovarajuće statističke tehnike. Najčešće korišćene tehnike u oblasti kreditnog rizika jesu binomna i ordinalna logistička regresija, prosta i višestruka linearna regresija, drvo odlučivanja, razne tehnike za monotono grupisanje podataka. Svaka od ovih tehnika podrazumijeva da modelirano obilježje ima odgovarajući tip i nivo mjerenja. Tako na primjer binomna logistička regresija zahtijeva binarno obilježje (dva moguća ishoda ili vrijednosti: dobar/loš, default/non-default…), ordinalna logistička regresija zahtijeva obilježje ordinalnog nivoa mjerenja (npr. rejting klase), linearna regresija zahtijeva numeričko obilježje (stope PD-ija ili LGD-ija), drvo odlučivanja je primjenjivo na numerička i kvalitativna obilježja bez obzira na nivo mjerenja.

Previous1.4. Korisničke funkcijeNext3. Deskriptivna statistika i grafičko predstavljanje podataka

Last updated 4 years ago

Was this helpful?