Luokitteluvirheen estimaattoreiden ja luokittelumenetelmien vertailu
Tutkimuksessa pohjaeläinaineiston pohjalta haluttiin simuloida yksilöitä, joita ryhdyttiin luokittelemaan eri luokittelumenetelmillä. Tarkastelun kohteena oli, miten luokittelumenetelmät vertailevat keskenään normaalijakautuneisuusoletuksen ollessa voimassa ja miten eri estimaattorien tulokset vertautuvat keskenään. Tavoitteena oli estimoida yleistämisvirhettä.
Kun mallissa on kaksi luokkaa ja kaksi piirettä otoskoon ollessa 50, havaittiin kvadraattisen luokittelijan olevan optimi normaalijakautunaisuusoletuksella tuottaessa pienimpiä virheitä. Lähimmäksi kvadraattisen luokittelijan tuloksia pääsi lineaarinen luokittelija. Vertaillessa luokittelijoita huonoiten suoriutui lähinaapurinmenetelmä. Erot lineaarisen luokittelijan ja tukivektorikoneiden välillä eivät olleet suuria, vaikkakin lineaarisen luokittelijanvaihtelu oli pienempää.
Kun otoskoko oli 500 ja mallit monimutkastuivat sisältäen 8 luokkaa ja 8 piirrettä, suoriutui lineaarinen luokittelija edelleen toisiksi parhaiten kvadraattisen luokittelijan antaessa pienimmät virheet. Neuroverkot ja lähinaapurinmenetelmä havaittiin suoriutuvan huonoiten. Tukivektorikone lineaarisella ytimellä suoriutui sädeperusteista paremmin ja myös sen vaihtelu pysyi pienempänä. Kolmannessa tapauksessa, missä luokkia oli 50 ja piirteitä 8 otoskoon ollessa 10000, suoriutui lähinaapurinmenetelmä edelleen muita menetelmiä huonommin. Alhaisimmat virheet olivat edelleen kvadraattisella luokittelijalla, mutta toiseksi parhaimmat tulokset tuotti satunnaismetsä.
Estimaattoreiden tulokset vaihtelivat tapauskohtaisesti. Toistuva jako opetus- ja testiaineistoksi jaolla 90/10, ristiinvalidointi arvolla K=N, sekä Err(.632)
havaittiin useasti eroavan vähiten yleistämisvirheestä. Toisaalta Err (.632) havaittiin myös useasti aliestimoimassa yleistämisvirhettä.
Huonoiten estimaattoreista suoriutuivat toistuva jako opetus- ja testiaineistoksi 50-50-jaolla, Err (1), sekä ristiinvalidointi arvolla K = 2.
...
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [29740]
License
Related items
Showing items with similar title or keywords.
-
Data from an International Multi-Centre Study of Statistics and Mathematics Anxieties and Related Variables in University Students (the SMARVUS Dataset)
Terry, Jenny; Ross, Robert M.; Nagy, Tamás; Salgado, Mauricio; Garrido-Vásquez, Patricia; Sarfo, Jacob O.; Cooper, Susan; Buttner, Anke C.; Lima, Tiago J. S.; Öztürk, İbrahim; Akay, Nazlı; Santos, Flavia H.; Artemenko, Christina; Copping, Lee T.; Elsherif, Mahmoud M.; Milovanović, Ilija; Cribbie, Robert A.; Drushlyak, Marina G.; Swainston, Katherine; Shou, Yiyun; Leongómez, Juan David; Palena, Nicola; Abidin, Fitri A.; Reyes-Rodríguez, Maria F.; He, Yunfeng; Abraham, Juneman; Vatakis, Argiro; Jankowsky, Kristin; Schmidt, Stephanie N. L.; Grimm, Elise; González, Desirée; Schmid, Philipp; Ferreira, Roberto A.; Rozgonjuk, Dmitri; Özhan, Neslihan; O’Connor, Patrick A.; Zsido, Andras N.; Stiglic, Gregor; Rhodes, Darren; Rodríguez, Cristina; Ropovik, Ivan; Enea, Violeta; Nurwanti, Ratri; Estudillo, Alejandro J.; Beribisky, Nataly; Himawan, Karel K.; Geven, Linda M.; Van Hoogmoed, Anne H.; Bret, Amélie; Chapman, Jodie E.; Alter, Udi; Flack, Zoe M.; Hanna, Donncha; Soltanlou, Mojtaba; Banik, Gabriel; Adamkovič, Matúš; Van der Ven, Sanne H. G.; Mosbacher, Jochen A.; Şen, Hilal H.; Anderson, Joel R.; Batashvili, Michael; De Groot, Kristel; Parker, Matthew O.; Helmy, Mai; Ostroha, Mariia M.; Gilligan-Lee, Katie A.; Egara, Felix O.; Barwood, Martin J.; Thomas, Karuna; McMahon, Grace; Griffin, Siobhán M.; Nuerk, Hans-Christoph; Counsell, Alyssa; Lindemann, Oliver; Van Rooy, Dirk; Wege, Theresa E.; Lewis, Joanna E.; Aczel, Balazs; Monaghan, Conal; Al-Hoorie, Ali H.; Huber, Julia F.; Yapan, Saadet; Garrido Vásquez, Mauricio E.; Callea, Antonino; Ergiyen, Tolga; Clay, James M.; Mertens, Gaetan; Topçu, Feyza; Tutlu, Merve G.; Täht, Karin; Mikkor, Kristel; Caso, Letizia; Karner, Alexander; Storm, Maxine M. C.; Daroczy, Gabriella; Zein, Rizqy A.; Greco, Andrea; Buchanan, Erin M.; Schmid, Katharina; Hunt, Thomas E.; De keersmaecker, Jonas; Branney, Peter E.; Randell, Jordan; Clark, Oliver J.; Steltenpohl, Crystal N.; Malu, Bhasker; Tekeş, Burcu; Ramis, TamilSelvan; Agrigoroaei, Stefan; Badcock, Nicholas A.; McAloney-Kocaman, Kareena; Semenikhina, Olena V.; Graf, Erich W.; Lea, Charlie; Ogba, Kalu T. U.; Guppy, Fergus M.; Warhurst, Amy C.; Lindsay, Shane; Al Khateeb, Ahmed; Scharnowski, Frank; De Kwaadsteniet, Leontien; Francis, Kathryn B.; Lecompte, Mariah; Webster, Lisa A. D.; Morsanyi, Kinga; Forwood, Suzanna E.; Walters, Elizabeth R.; Tip, Linda K.; Wagge, Jordan R.; Lai, Ho Yan; Crossland, Deborah S.; Darda, Kohinoor M.; Flack, Tessa R.; Leviston, Zoe; Brolly, Matthew; Hills, Samuel P.; Collins, Elizabeth; Roberts, Andrew J.; Cheung, Wing-Yee; Leonard, Sophie; Verschuere, Bruno; Stanley, Samantha K.; Xenidou-Dervou, Iro; Ghasemi, Omid; Liew, Timothy; Ansari, Daniel; Guilaran, Johnrev; Penny, Samuel G.; Bahnmueller, Julia; Hand, Christopher J.; Rahajeng, Unita W.; Peterburg, Dar; Takacs, Zsofia K.; Platow, Michael J.; Field, Andy P. (Ubiquity Press, 2023)This large, international dataset contains survey responses from N = 12,570 students from 100 universities in 35 countries, collected in 21 languages. We measured anxieties (statistics, mathematics, test, trait, social ... -
A classification of C-Fuchsian subgroups of Picard modular groups
Parkkonen, Jouni; Paulin, Frédéric (Aarhus Universitet; Svenska Matematikersamfundet, 2017) -
Cross‐national validation of the Social Media Disorder‐scale : Findings from adolescents from 44 countries
Boer, Maartje; Eijnden, Regina J. J. M.; Finkenauer, Catrin; Boniel‐Nissim, Meyran; Marino, Claudia; Inchley, Jo; Cosma, Alina; Paakkari, Leena; Stevens, Gonneke W. J. M. (Wiley-Blackwell, 2022)Background and aims There is currently no cross-national validation of a scale that measures problematic social media use (SMU). The present study investigated and compared the psychometric properties of the Social Media ... -
Developing and testing sub-band spectral features in music genre and music mood machine learning
Prezja, Fabi (2018)In the field of artificial intelligence, supervised machine learning enables us to try to develop automatic recognition systems. In music information retrieval, training and testing such systems is possible with a variety ... -
Metallinetsinlöytöjen määrä, laatu ja merkitys : luokittelu löytöjen arvon määrittäjänä
Karjalainen, Mari (2021)Maisterintutkielman taustalla on 2010-luvulta alkaen lisääntynyt metallinetsintäharrastajien määrän kasvu. Sen seurauksena museoon toimitetut ja kokoelmiin liitetyt löytömäärät ovat huomattavasti kasvaneet. ...