Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
Tutkielmassa on tarkoitus selvittää vesimuodostumien kunnostustarvetta logistisella regressiomallilla. Vaste eli kunnostustarve on muunnos alkuperäisen
aineiston viisiportaisesta ekologinen tila -muuttujasta. Haluttiin selvittää,
voiko sitä ennustaa aineiston rekisterimuuttujilla, koska nämä ovat helposti
saatavilla.
Koska aineistossa oli paljon puuttuvaa tietoa, käytettiin sen imputoimiseen moni-imputointia. Kaksi oleellista asiaa imputoinnin toteutuksen kannalta olivat, mitä muuttujia käytetään toisten muuttujien imputointiin ja
mitä imputointimenetelmiä mihinkin muuttujaan sovelletaan. R-ohjelmiston
mice-funktio tarjoaa vaihtoehtoja näiden ratkaisemiseen. Tutkimusongelmaa
eli sitä, mitä muuttujia kunnostustarpeen ennustamiseen kannattaa käyttää,
selvitettiin siten, että aineistoon sovitettiin erilaisia malleja, joita vertailtiin
useilla kriteereillä. Esimerkiksi mallin antamaa tulosta siitä, tarvitseeko vesimuodostumaa kunnostaa, verrattiin todelliseen kunnostustarpeeseen, mikä
oli tässä aineistossa tiedossa. Oleellista oli löytää ne rekisterimuuttujat, jotka
parhaiten ennustavat kunnostustarvetta.
Imputointien perusteella kunnostustarpeen ennustamiseen kannattaa käyttää seuraavia muuttujia: leveysaste, keskisyvyys, suurin syvyys, kunnan pinta-
ala, kunnan väkiluku, piiri, korkeus merenpinnasta, maatalousmaan osuus,
suuralue Helsinki, suuralue pohjoinen, suuralue etelä, valuma-alueen peltoala
ja valuma-alueen suhteellinen peltopinta-ala. Lisäksi kannattaa käyttää leveysasteen ja maatalousmaan osuuden yhteisvaikutusta. Luokitteluvirhe imputoiduille aineistoille on vielä 11.6 % ja useimmiten vielä niin päin, että
malli ei löydä niitä vesimuodostumia, joilla on kunnostustarvetta. Jopa 52.5
% vesimuodostumista, jotka olivat kunnostustarpeessa, jäi löytämättä. Toisaalta toisin päin luokitteluvirhe oli parempi. Kunnostustarvetta ennustettiin
3.2 %:ssa tapauksia silloin, kun sitä ei ollut.
...
Asiasanat
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29740]
Lisenssi
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Moni-imputoinnin ja sekamallien sovellus Liikkuva koulu -aineistoon : kyselylomakkeella ja mittarilla mitatun liikunnan ero
Pesonen, Pinja (2018)Tämän pro gradu -tutkielman tarkoituksena oli etsiä mahdollisia taustatekijöitä, jotka vaikuttavat lasten ja nuorten itsearvioidun liikunnan määrän ali- tai yliarvioimiseen. Aineistona käytettiin maanlaajuisen Liikkuva ... -
Logistisen regressiomallin selitysasteesta
Puntila, Eero (1991) -
Puuttuva tieto ja vilppi
Karvanen, Juha (Tieteellisten Seurain Valtuuskunta, 2015) -
K:n prototyypin ryhmittelymenetelmän ja moni-imputoinnin sovellus työhyvinvointiaineistoon
Ahtinen, Suvi (2020)Tässä tutkielmassa sovelletetaan k:n prototyypin ryhmittelymenetelmää aineistoon, joka perustuu peruskoulun ja toisen asteen oppilaitosten henkilökunnan mielipidekyselyyn omasta työhyvinvoinnistaan. Menetelmä on valittu, ... -
Analysis and evaluation of cell imputation
Horppu, Ismo (University of Jyväskylä, 2008)
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.