Naslov Generalizirani linearni modeli
Naslov (engleski) Generalized linear models
Autor Antonija Andrijević
Mentor Miljenko Huzak (mentor)
Član povjerenstva Miljenko Huzak (predsjednik povjerenstva)
Član povjerenstva Nenad Antonić (član povjerenstva)
Član povjerenstva Ozren Perše (član povjerenstva)
Član povjerenstva Ilja Gogić (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Zagrebu Prirodoslovno-matematički fakultet (Matematički odsjek) Zagreb
Datum i država obrane 2024-09-27, Hrvatska
Znanstveno / umjetničko područje, polje i grana PRIRODNE ZNANOSTI Matematika
Sažetak Za vektor međusobno nezavisnih slučajnih varijabli
Y = ( Y 1 , … , Y n ) T za koje pretpostavljamo da ovise o vrijednostima
x 1 , … , x p generalizirane linearne modele definiramo kao
{ Y i ∼ E F D ( θ i ) E [ Y i ] = μ i = q − 1 ( x T i β ) , za
i = 1 , … , n . Slučajne varijable
Y i ∼ E F D ( θ i ) dolaze iz eksponencijalne familije distribucija u
... Više standardnoj formi, čija gustoća ovisi o parametru θ i . Ta familija uključuje brojne poznate statističke distribucije, uključujući binomnu, normalnu, Poissonovu i gama distribuciju te mnoge druge. Na ovaj način generalizirani linearni modeli omogućuju modeliranje zavisne varijable $\boldsymbol{Y}$ koja pripada i drugim distribucijama, ne samo normalnoj. Nadalje, funkcija g iz gornjeg zapisa je monotono diferencijabila funkcija koju nazivamo funkcija poveznica. Ona povezuje distribuciju zavisne varijable, njeno očekivanje i varijancu, s linearnom kombinacijom nezavisnih varijabli x T i β . Na ovaj nam način generalizirani linearni modeli omogućuju modeliranje i nelinearnih veza. Nepoznate parametre β = ( β 0 , β 1 , … , β p ) T procjenjujemo metodom najveće vjerodostojnosti, tražeći maksimum b = ( b 0 , b 1 , … , b p ) T funkcije log-vjerodostojnosti na temelju uzorka y . Maksimizacija se svodi na traženje nultočaka parcijalnih derivacija log-vjerodostojnosti. Ovisno o složenosti, nultočke možemo tražiti analitički ili iterativnom težinskom metodom najmanjih kvadrata koja koristi Fisherov algoritam za poboljšanje procjena parametara putem težinske matrice i pseudo-odgovora. Nakon što smo procijenili parametre generaliziranog linearnog modela i dobili jednadžbu modela, želimo provjeriti preciznost modela statističkim inferencijama koje uključuju testiranje statističkih hipoteza o značajnosti parametara, modela te usporedba modela korištenjem asimptotske N ( 0 , 1 ) i χ 2 distribucije, kao i izračunavanje pouzdanih intervala. Nakon što potvrdimo da smo dobili precizan model, možemo ga koristiti za donošenje odluka. Sakrij dio sažetka
Sažetak (engleski) For a vector of independent random variables
Y = ( Y 1 , … , Y n ) T , where we assume that they depend on the values $x_1, \ldots, x_p$, generalized linear models are defined as
{ Y i ∼ E F D ( θ i ) E [ Y i ] = μ i = q − 1 ( x T i β ) , for
i = 1 , … , n . The random variables
Y i ∼ E F D ( θ i ) come from the exponential family of distributions in
... Više standard form, with the density depending on the parameter θ i . This family includes numerous well-known statistical distributions, such as the binomial, normal, Poisson, and gamma distributions, among many others. In this way, generalized linear models allow modeling of the dependent variable Y that belongs to distributions other than just the normal distribution. Furthermore, the function g in the above expression is a monotonic differentiable function called the link function. It connects the distribution of the dependent variable, its expectation, and its variance with the linear combination of the independent variables x T i β . This way, generalized linear models enable the modeling of nonlinear relationships as well. The unknown parameters β = ( β 0 , β 1 , … , β p ) T are estimated using the method of maximum likelihood by finding the maximum b = ( b 0 , b 1 , … , b p ) T of the log-likelihood function based on the sample y . Maximization reduces to finding the zeroes of the partial derivatives of the log-likelihood. Depending on the complexity, the zeroes can be found either analytically or by an iterative weighted least squares method, which uses Fisher's scoring algorithm to improve parameter estimates via a weight matrix and pseudo-responses. Once the parameters of the generalized linear model have been estimated and the model equation obtained, we want to assess the accuracy of the model through statistical inferences, which include hypothesis testing for the significance of parameters, testing the overall model, and model comparison using the asymptotic N ( 0 , 1 ) and χ 2 distributions, as well as the computation of confidence intervals. Once we confirm the precision of the model, it can be used for decision-making. Sakrij dio sažetka
Ključne riječi
slučajne varijable
generalizirani linearni modeli
Ključne riječi (engleski)
random variables
generalized linear models
Jezik hrvatski
URN:NBN urn:nbn:hr:217:531545
Studijski program Naziv: Matematička statistika Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: sveučilišni magistar matematike (univ. mag. math.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Otvoreni pristup
Uvjeti korištenja
Datum i vrijeme pohrane 2025-02-05 12:26:27