Luokitteluvirheen estimaattoreiden ja luokittelumenetelmien vertailu

Sorvali, Jesse

dc.contributor.advisor	Kärkkäinen, Salme
dc.contributor.advisor	Karvanen, Juha
dc.contributor.author	Sorvali, Jesse
dc.date.accessioned	2023-06-08T04:45:31Z
dc.date.available	2023-06-08T04:45:31Z
dc.date.issued	2023
dc.identifier.uri	https://jyx.jyu.fi/handle/123456789/87529
dc.description.abstract	Tutkimuksessa pohjaeläinaineiston pohjalta haluttiin simuloida yksilöitä, joita ryhdyttiin luokittelemaan eri luokittelumenetelmillä. Tarkastelun kohteena oli, miten luokittelumenetelmät vertailevat keskenään normaalijakautuneisuusoletuksen ollessa voimassa ja miten eri estimaattorien tulokset vertautuvat keskenään. Tavoitteena oli estimoida yleistämisvirhettä. Kun mallissa on kaksi luokkaa ja kaksi piirettä otoskoon ollessa 50, havaittiin kvadraattisen luokittelijan olevan optimi normaalijakautunaisuusoletuksella tuottaessa pienimpiä virheitä. Lähimmäksi kvadraattisen luokittelijan tuloksia pääsi lineaarinen luokittelija. Vertaillessa luokittelijoita huonoiten suoriutui lähinaapurinmenetelmä. Erot lineaarisen luokittelijan ja tukivektorikoneiden välillä eivät olleet suuria, vaikkakin lineaarisen luokittelijanvaihtelu oli pienempää. Kun otoskoko oli 500 ja mallit monimutkastuivat sisältäen 8 luokkaa ja 8 piirrettä, suoriutui lineaarinen luokittelija edelleen toisiksi parhaiten kvadraattisen luokittelijan antaessa pienimmät virheet. Neuroverkot ja lähinaapurinmenetelmä havaittiin suoriutuvan huonoiten. Tukivektorikone lineaarisella ytimellä suoriutui sädeperusteista paremmin ja myös sen vaihtelu pysyi pienempänä. Kolmannessa tapauksessa, missä luokkia oli 50 ja piirteitä 8 otoskoon ollessa 10000, suoriutui lähinaapurinmenetelmä edelleen muita menetelmiä huonommin. Alhaisimmat virheet olivat edelleen kvadraattisella luokittelijalla, mutta toiseksi parhaimmat tulokset tuotti satunnaismetsä. Estimaattoreiden tulokset vaihtelivat tapauskohtaisesti. Toistuva jako opetus- ja testiaineistoksi jaolla 90/10, ristiinvalidointi arvolla K=N, sekä Err(.632) havaittiin useasti eroavan vähiten yleistämisvirheestä. Toisaalta Err (.632) havaittiin myös useasti aliestimoimassa yleistämisvirhettä. Huonoiten estimaattoreista suoriutuivat toistuva jako opetus- ja testiaineistoksi 50-50-jaolla, Err (1), sekä ristiinvalidointi arvolla K = 2.	fi
dc.format.extent	52
dc.language.iso	fi
dc.rights	In Copyright
dc.title	Luokitteluvirheen estimaattoreiden ja luokittelumenetelmien vertailu
dc.type	master thesis
dc.identifier.urn	URN:NBN:fi:jyu-202306083598
dc.type.ontasot	Master’s thesis	en
dc.type.ontasot	Pro gradu -tutkielma	fi
dc.contributor.tiedekunta	Matemaattis-luonnontieteellinen tiedekunta	fi
dc.contributor.tiedekunta	Faculty of Sciences	en
dc.contributor.laitos	Matematiikan ja tilastotieteen laitos	fi
dc.contributor.laitos	Department of Mathematics and Statistics	en
dc.contributor.yliopisto	Jyväskylän yliopisto	fi
dc.contributor.yliopisto	University of Jyväskylä	en
dc.contributor.oppiaine	Tilastotiede	fi
dc.contributor.oppiaine	Statistics	en
dc.type.coar	http://purl.org/coar/resource_type/c_bdcc
dc.rights.copyright	© The Author(s)
dc.rights.accesslevel	openAccess
dc.type.publication	masterThesis
dc.contributor.oppiainekoodi	4043
dc.subject.yso	matematiikka
dc.subject.yso	luokitus (toiminta)
dc.subject.yso	validointi
dc.subject.yso	tilastotiede
dc.rights.url	https://rightsstatements.org/page/InC/1.0/

Aineistoon kuuluvat tiedostot

Nimi:: URN:NBN:fi:jyu-202306083598.pdf
Koko:: 381.3Kb
Tiedostomuoto:: PDF

Katso/Avaa

Aineisto kuuluu seuraaviin kokoelmiin

Pro gradu -tutkielmat [29740]

Näytä suppeat kuvailutiedot

Ellei muuten mainita, aineiston lisenssi on In Copyright

Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.

Data from an International Multi-Centre Study of Statistics and Mathematics Anxieties and Related Variables in University Students (the SMARVUS Dataset)

Terry, Jenny; Ross, Robert M.; Nagy, Tamás; Salgado, Mauricio; Garrido-Vásquez, Patricia; Sarfo, Jacob O.; Cooper, Susan; Buttner, Anke C.; Lima, Tiago J. S.; Öztürk, İbrahim; Akay, Nazlı; Santos, Flavia H.; Artemenko, Christina; Copping, Lee T.; Elsherif, Mahmoud M.; Milovanović, Ilija; Cribbie, Robert A.; Drushlyak, Marina G.; Swainston, Katherine; Shou, Yiyun; Leongómez, Juan David; Palena, Nicola; Abidin, Fitri A.; Reyes-Rodríguez, Maria F.; He, Yunfeng; Abraham, Juneman; Vatakis, Argiro; Jankowsky, Kristin; Schmidt, Stephanie N. L.; Grimm, Elise; González, Desirée; Schmid, Philipp; Ferreira, Roberto A.; Rozgonjuk, Dmitri; Özhan, Neslihan; O’Connor, Patrick A.; Zsido, Andras N.; Stiglic, Gregor; Rhodes, Darren; Rodríguez, Cristina; Ropovik, Ivan; Enea, Violeta; Nurwanti, Ratri; Estudillo, Alejandro J.; Beribisky, Nataly; Himawan, Karel K.; Geven, Linda M.; Van Hoogmoed, Anne H.; Bret, Amélie; Chapman, Jodie E.; Alter, Udi; Flack, Zoe M.; Hanna, Donncha; Soltanlou, Mojtaba; Banik, Gabriel; Adamkovič, Matúš; Van der Ven, Sanne H. G.; Mosbacher, Jochen A.; Şen, Hilal H.; Anderson, Joel R.; Batashvili, Michael; De Groot, Kristel; Parker, Matthew O.; Helmy, Mai; Ostroha, Mariia M.; Gilligan-Lee, Katie A.; Egara, Felix O.; Barwood, Martin J.; Thomas, Karuna; McMahon, Grace; Griffin, Siobhán M.; Nuerk, Hans-Christoph; Counsell, Alyssa; Lindemann, Oliver; Van Rooy, Dirk; Wege, Theresa E.; Lewis, Joanna E.; Aczel, Balazs; Monaghan, Conal; Al-Hoorie, Ali H.; Huber, Julia F.; Yapan, Saadet; Garrido Vásquez, Mauricio E.; Callea, Antonino; Ergiyen, Tolga; Clay, James M.; Mertens, Gaetan; Topçu, Feyza; Tutlu, Merve G.; Täht, Karin; Mikkor, Kristel; Caso, Letizia; Karner, Alexander; Storm, Maxine M. C.; Daroczy, Gabriella; Zein, Rizqy A.; Greco, Andrea; Buchanan, Erin M.; Schmid, Katharina; Hunt, Thomas E.; De keersmaecker, Jonas; Branney, Peter E.; Randell, Jordan; Clark, Oliver J.; Steltenpohl, Crystal N.; Malu, Bhasker; Tekeş, Burcu; Ramis, TamilSelvan; Agrigoroaei, Stefan; Badcock, Nicholas A.; McAloney-Kocaman, Kareena; Semenikhina, Olena V.; Graf, Erich W.; Lea, Charlie; Ogba, Kalu T. U.; Guppy, Fergus M.; Warhurst, Amy C.; Lindsay, Shane; Al Khateeb, Ahmed; Scharnowski, Frank; De Kwaadsteniet, Leontien; Francis, Kathryn B.; Lecompte, Mariah; Webster, Lisa A. D.; Morsanyi, Kinga; Forwood, Suzanna E.; Walters, Elizabeth R.; Tip, Linda K.; Wagge, Jordan R.; Lai, Ho Yan; Crossland, Deborah S.; Darda, Kohinoor M.; Flack, Tessa R.; Leviston, Zoe; Brolly, Matthew; Hills, Samuel P.; Collins, Elizabeth; Roberts, Andrew J.; Cheung, Wing-Yee; Leonard, Sophie; Verschuere, Bruno; Stanley, Samantha K.; Xenidou-Dervou, Iro; Ghasemi, Omid; Liew, Timothy; Ansari, Daniel; Guilaran, Johnrev; Penny, Samuel G.; Bahnmueller, Julia; Hand, Christopher J.; Rahajeng, Unita W.; Peterburg, Dar; Takacs, Zsofia K.; Platow, Michael J.; Field, Andy P. (Ubiquity Press, 2023)

This large, international dataset contains survey responses from N = 12,570 students from 100 universities in 35 countries, collected in 21 languages. We measured anxieties (statistics, mathematics, test, trait, social ...
A classification of C-Fuchsian subgroups of Picard modular groups

Parkkonen, Jouni; Paulin, Frédéric (Aarhus Universitet; Svenska Matematikersamfundet, 2017)
Cross‐national validation of the Social Media Disorder‐scale : Findings from adolescents from 44 countries

Boer, Maartje; Eijnden, Regina J. J. M.; Finkenauer, Catrin; Boniel‐Nissim, Meyran; Marino, Claudia; Inchley, Jo; Cosma, Alina; Paakkari, Leena; Stevens, Gonneke W. J. M. (Wiley-Blackwell, 2022)

Background and aims There is currently no cross-national validation of a scale that measures problematic social media use (SMU). The present study investigated and compared the psychometric properties of the Social Media ...
Developing and testing sub-band spectral features in music genre and music mood machine learning

Prezja, Fabi (2018)

In the field of artificial intelligence, supervised machine learning enables us to try to develop automatic recognition systems. In music information retrieval, training and testing such systems is possible with a variety ...
Metallinetsinlöytöjen määrä, laatu ja merkitys : luokittelu löytöjen arvon määrittäjänä

Karjalainen, Mari (2021)

Maisterintutkielman taustalla on 2010-luvulta alkaen lisääntynyt metallinetsintäharrastajien määrän kasvu. Sen seurauksena museoon toimitetut ja kokoelmiin liitetyt löytömäärät ovat huomattavasti kasvaneet. ...

Luokitteluvirheen estimaattoreiden ja luokittelumenetelmien vertailu

Aineistoon kuuluvat tiedostot

Aineisto kuuluu seuraaviin kokoelmiin

Samankaltainen aineisto

Data from an International Multi-Centre Study of Statistics and Mathematics Anxieties and Related Variables in University Students (the SMARVUS Dataset) ﻿

A classification of C-Fuchsian subgroups of Picard modular groups ﻿

Cross‐national validation of the Social Media Disorder‐scale : Findings from adolescents from 44 countries ﻿

Developing and testing sub-band spectral features in music genre and music mood machine learning ﻿

Metallinetsinlöytöjen määrä, laatu ja merkitys : luokittelu löytöjen arvon määrittäjänä ﻿

Data from an International Multi-Centre Study of Statistics and Mathematics Anxieties and Related Variables in University Students (the SMARVUS Dataset)

A classification of C-Fuchsian subgroups of Picard modular groups

Cross‐national validation of the Social Media Disorder‐scale : Findings from adolescents from 44 countries

Developing and testing sub-band spectral features in music genre and music mood machine learning

Metallinetsinlöytöjen määrä, laatu ja merkitys : luokittelu löytöjen arvon määrittäjänä