2. Tipovi i nivoi mjerenja statističkih obilježja
Dva osnovna tipa statističkih obilježja (slučajnih promjenljivih, varijabli) jesu kvalitativna i kvantitativna obilježja. Ukoliko je ispitivana pojava nenumerička, onda se radi o kvalitativnom obilježju. Brojni su primjeri kvalitativnih obilježja: pol, region, bračni status… Nasuprot kvalitativnom obilježju, ukoliko se ispitivano obilježje može tačno numerički predstaviti (godine starosti, iznos kredita, BDP, stopa nezaposlenosti, zarada, kamatna stopa…), onda se radi o kvantitativnom tipu obilježja. Najčešće ispitivanje statističkih pojava podrazumijeva kombinaciju kvalitativnih i kvantitativnih obilježja.
Još jedna podjela obilježja, koja je usko povezana sa prethodno navedenim tipovima obilježja, jeste podjela na prekidna i neprekidna obilježja. Prekidna obilježja predstavljaju sva obilježja koja sadrže prebrojivo mnogo vrijednosti, dok neprekidna obilježja predstavljaju sva obilježja koja imaju neprebrojivo mnogo vrijednosti. Primjer prekidnog obilježja bio bi broj odobrenih kredita u nekom mjesecu, dok bi neprekidno obilježje bio odobreni iznos kredita ili kamatna stopa.
Obilježja mogu biti klasifikovana i u zavisnosti od nivoa mjerenja.
Nominalni nivo mjerenja imaju ona kvalitativna obilježja koja se mogu samo klasifikovati i prebrojati i za koja ne postoji standardizovano pravilo rangiranja. Primjer nominalnog nivos mjerenja jeste pol. Pol osobe može biti klasifikovan i prebrojan, ali ne postoji pravilo po kome se vrijednosti mogu rangirati odnoso reći da je osoba ženskog pola ‘bolja’ od osobe muškog.
Ordinalni nivo mjerenja predstavlja sljedeći i viši nivo mjerenja od nominalnog. Za razliku od nominalnog nivoa mjerenja, kod ordinalnog nivoa obilježja mogu biti rangirana po nekom standardizovom pravilu. Primjer ordinalnog nivoa mjerenja mogu biti grupe dana kašnjenja klijenata banke: od 0 do 30 dana, od 31 do 90 dana, 91 i više dana. Nedostatak ordinalnog nivoa mjerenja jeste taj što, i pored toga što grupe obilježja mogu biti rangirane, razlike između grupa obilježja ne mogu biti kvantifikovane, odnosno ne možemo utvrditi za koliko jedinica je neka grupa ‘bolja‘ od druge (za koliko su klijenti koji pripadaju grupi od 0 do 30 dana kašnjenja bolji od klijenata iz grupe 91 i više dana).
Obilježja koja pored toga što njihove grupe mogu biti rangirane posjeduju i karakteristiku da se razlika između grupa može kvantifikovati, imaju intervalni nivo mjerenja. Primjer intervalnog nivoa mjerenja može biti kamatna stopa.
Najveći nivo mjerenja nekog obilježja jeste racio nivo. Ovaj nivo mjerenja ima sve karakteristike kao i intervalni nivo, uključujući i postojanje prirodne nule kao početne tačke. Naime, količnik dvije vrijednosti obilježja intervalnog nivoa mjerenja nema značenje, tj. ne možemo reći da je kamatna stopa od 1% tri puta veća nego kamatna stopa od -3%. Razlog ovome je što intervalni nivo mjerenja ne sadrži prirodnu nulu kao početnu tačku mjerenja (0% kamatna stopa nije najniža moguća vrijednost). Primjer racio nivoa mjerenja može biti iznos odobrenog kredita. Ako je prva vrijednost obilježja 1000 eura, a druga 3000 eura, količnik ove dvije vrijednosti je smislen, odnosno može se reći da je druga vrijednost obilježja tri puta veća od prve vrijednosti obilježja. Može se primijetiti da iznos kredita kao ispitivano obilježje sadrži prirodnu nulu kao početnu tačku.
Razumijevanje tipa i novoa mjerenja ispitivanog obilježja od izuzetnog je značaja za odabir odgovarajuće statističke tehnike. Najčešće korišćene tehnike u oblasti kreditnog rizika jesu binomna i ordinalna logistička regresija, prosta i višestruka linearna regresija, drvo odlučivanja, razne tehnike za monotono grupisanje podataka. Svaka od ovih tehnika podrazumijeva da modelirano obilježje ima odgovarajući tip i nivo mjerenja. Tako na primjer binomna logistička regresija zahtijeva binarno obilježje (dva moguća ishoda ili vrijednosti: dobar/loš, default/non-default…), ordinalna logistička regresija zahtijeva obilježje ordinalnog nivoa mjerenja (npr. rejting klase), linearna regresija zahtijeva numeričko obilježje (stope PD-ija ili LGD-ija), drvo odlučivanja je primjenjivo na numerička i kvalitativna obilježja bez obzira na nivo mjerenja.
Last updated
Was this helpful?