Abstract | Osiguravajućim društvima je za potrebe vrednovanja očekivanih obveza i održavanje potrebne solventnosti kapitala važna dobra procjena smrtnosti osiguranika. U praksi, postupak procjene smrtnosti osiguranika se susreće sa širokim rasponom podataka i analitičkim izazovima. U ovom radu, za analizu smrtnosti osiguranika u Sjedinjenim Američkim Državama primjenjuje se pristup modeliranja primjenom logističke regresije koji omogućuje korištenje manje podataka, ali relevantnijih za modeliranje i ekstrapoliranje procjena. Logistička regresija predstavlja vrstu regresijske analize u kojoj je zavisna (odzivna) varijabla dihotomna, odnosno binarna i kodira se s 0 ili 1 te postoji najmanje jedna nezavisna odnosno prediktorska varijabla koja može biti kategorijska ili kontinuirana. Navedeno u stvarnosti predstavlja modeliranje bilo kojeg problema kod kojeg se ciljni događaj može prevesti u kategorijsku varijablu (da/ne, živ/mrtav, zdrav/bolestan). Logistički model za q ima mnoge prednosti za analizu smrtnosti osiguranika: modelira stopu smrtnosti q koji se izravno može koristiti u određivanju cijene police i upravljanju rizicima, može se lako prilagoditi za potrebe procjenjivanja razine, nagiba krivulje i razlika u smrtnosti (ključni pokazatelji koje se koriste u poslovnoj praksi) i može se primjenjivati široko dostupnima statističkim računalnim programima. Za potencijalne nezavisne varijable modela odabrano je devet varijabli zato što im najmanje nedostaju podaci i najčešće se koriste za donošenje odluka o cijenama, pokrivenim rizicima i marketinškim strategijama. Od devet nezavisnih varijabli, spol i status pušenja osiguranika se koriste za osnovnu podjelu podataka studije, a sedam varijabli je ostavljeno kako bi bile uključene u ta četiri modela kao nezavisne varijable. Kao što se očekivalo, statistički, smrtnost osiguranika u sve četiri skupine značajno varira po trajanju police osiguranja, pristupnoj dobi osiguranika, vrijednosti police, razdoblju i klasi pokrivenih rizika. To potvrđuje da su ove varijable među najpouzdanijim pokazateljima stope smrtnosti. Na razini značajnosti od 95%, svih sedam testiranih varijabli statistički su značajni u barem jednoj od četiri skupine polica pa su uključene u sva četiri logistička modela za q. |
Abstract (english) | Insured population mortality estimation is essential to insurers’ developing liability expectations and maintaining required solvency capital. In practice, insured mortality measurement needs to deal with a broad range of data and analytical challenges. In this paper, we introduce a logistic regression-based modeling approach for analyzing the U.S. insured mortality experience. This approach allows use of less but more relevant data to address multiple challenges in quantifying insured mortality. Logistic regression is a regression model where the dependent variable is categorical, binary variable where the output can take only two values, 0 and 1, and is related to at least one of explanatory variables, which can be discrete and/or continuous. In practice, this is modeling of any problem type which answer represent outcomes such as win/lose, alive/dead or healthy/sick (discrete variable). A logistic q model has many advantages for insured experience studies: it models mortality q that is directly used in business operation and risk management; it can be flexibly configured for estimating mortality levels, slopes and differentials that are key metrics used in business practices; and it can be developed with widely available commercial software systems. Nine observable explanatory variables are selected as potential independent variables for model development. These variables are selected because they have the least missing values and are the most frequently used for pricing decisions, underwriting adjustments and marketing strategies. Of the nine explanatory variables, gender and smoking status are used to split the study data and seven are left to be included in the models. As expected, insured mortality varies significantly statistically by duration, issue age, underwriting class, underwriting era and face band for all four subgroups. This confirms that these variables are among the most reliable mortality predictors. At 95 percent confidence level, all seven tested variables have statistical significance in explaining mortality variation in at least one of the four policy groups so we included them in all four logistic q models. |