Yliopistotutkintojen määrän ennustaminen Bayes-mallilla
Tämän tutkielman tarkoituksena on kehittää prediktiivinen malli, jolla ennustetaan Jyväskylän yliopiston matemaattis-luonnontieteellisessä tiedekunnassa lähivuosina suoritettavien luonnontieteiden kandidaatin ja filosofian maisterin tutkintojen lukumääriä. Mallin estimointiin käytettävä aineisto koostuu kolmesta osasta: vuosina 1996–2004 tiedekunnassa aloittaneet opiskelijat, vuosina 2005–2015 tiedekunnassa alemmasta korkeakoulututkinnosta aloittaneet opiskelijat ja vuosina 2005–2016 tiedekunnassa ylemmästä korkeakoulututkinnosta aloittaneet opiskelijat. Jokaiselle aineiston osalle sovitetaan omat toisistaan riippumattomat osamallit. Tutkintoennusteet saadaan ennustamalla aineistoon kuuluville yhä tutkintoa vaille oleville opiskelijoille mahdolliset tutkinnot seuraaville kalenterivuosille.
Vuonna 2005 ja sen jälkeen aloittaneiden opiskelijoiden opintoja mallinnetaan käyttäen tilaketjuja, joiden tilat määritellään opiskelijan opintopistekertymän ja aktiivisen opinto-oikeuden perusteella. Mallissa opiskelijat suorittavat aina kalenterivuoden päätteeksi tilasiirtymän mallin tilasta toiseen ja tutkintoennusteita varten opiskelijoille arvotaan tilasiirtymät tuleville kalenterivuosille. Opiskelijoille estimoidaan multinomiaalisella logistisella regressiolla tilasiirtymätodennäköisyydet, joiden perusteella tilasiirtymät arvotaan. Tilasiirtymätodennäköisyyksiä selitetään opiskelijoiden ominaisuuksilla, kuten opintojen kestolla ja opiskelijan iällä opintojen alussa. Mallin regressiokertoimet estimoidaan hierarkkisella Bayes-mallilla käyttäen Markovin ketju Monte Carlo -menetelmää. Ennen vuotta 2005 aloittaneiden opiskelijoiden aineistolle sovitetaan yksinkertaisempi malli, jossa opiskelijoiden tutkinnonsuorittamistodennäköisyyksiä estimoidaan binäärisellä logistisella regressiolla.
Ennusteita varten sovitetaan useita erilaisia malleja, jotka eroavat toisistaan sen perusteella, kuinka malleissa käytettävät selittävät muuttujat on valittu. Eri malleilla saatuja tutkintoennusteita vertaillaan ja pohditaan, millä mallilla saadaan parhaimmat tutkintoennusteet. Myös siirtymätodennäköisyyksiä estimoivia regressiokertoimia tulkitaan ja katsotaan, mitkä tekijät vaikuttavat positiivisesti ja mitkä negatiivisesti yliopisto-opintojen etenemiseen. Lisäksi opiskelijoiden tutkinnonsuorittamistodennäköisyyksiä vertaillaan simuloimalla erilaisten opiskelijoiden opintojen kulkua opintojen alusta seitsemän vuotta eteenpäin.
...
Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29684]
License
Related items
Showing items with similar title or keywords.
-
C-reaktiivisen proteiinin määrän bayesiläinen ennustaminen Tobit-mallilla
Manninen, Tuomas (2011) -
Bayes-malli tyypin 2 diabetekseen liittyville tilasiirtymille
Pasanen, Tiia-Maria (2020)Tyypin 2 diabetes on Suomessa kansantaudiksi luokiteltava glukoosiaineenvaihdunnan häiriö, joka aiheuttaa yhteiskunnalle jatkuvasti kasvavia kustannuksia ja heikentää sairastuneen elämänlaatua. Tauti todetaan tyypillisesti ... -
Kausaalimalli lääkeannostuksen aiheuttamalle kuolleisuudelle tehohoitopotilailla
Tabell, Otto (2024)Dexmedetomidine is a sedative drug which is especially used to sedate patients in intensive care. In 2019, SPICE III researchers reported of a worrying safety signal related to the drug. According to the study, under ... -
Bayesian semiparametric long memory models for discretized event data
Chakraborty, Antik; Ovaskainen, Otso; Dunson, David B. (Institute of Mathematical Statistics, 2022)We introduce a new class of semiparametric latent variable models for long memory discretized event data. The proposed methodology is motivated by a study of bird vocalizations in the Amazon rain forest; the timings of ... -
Conditional particle filters with diffuse initial distributions
Karppinen, Santeri; Vihola, Matti (Springer, 2021)Conditional particle filters (CPFs) are powerful smoothing algorithms for general nonlinear/non-Gaussian hidden Markov models. However, CPFs can be inefficient or difficult to apply with diffuse initial distributions, which ...