dc.contributor.advisor | Kärkkäinen, Salme | |
dc.contributor.advisor | Ärje, Johanna | |
dc.contributor.author | Veistämö, Tommi | |
dc.date.accessioned | 2019-07-02T05:08:47Z | |
dc.date.available | 2019-07-02T05:08:47Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/64933 | |
dc.description.abstract | Pohjaeläinten koneellinen tunnistaminen vähentäisi merkittävästi pohjaeläinten luokitteluun tarvittavaa työmäärää nykyiseen tilanteeseen verrattuna ja nopeuttaisi biologisten indeksien laskemista. Pohjaeläimistä laskettavat biologiset indeksit kertovat vesistöjen ekologisesta tilasta, joten niiden estimoiminen tarkasti on tärkeää. Koneellinen luokitteleminen aiheuttaa kuitenkin virheitä pohjaeläinten taksonomisten ryhmien tunnistamisessa, koska luokittelussa yksilö voi ominaisuuksiensa perusteella päätyä väärään taksonomiseen ryhmään. Näiden virheiden korjaamiseksi sovelletaan kolmea korjausmenetelmää: käyttäjän sekaannusmatriisikorjaus, tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus. Menetelmien toimivuutta tutkitaan 12 yleisen biologisen indeksin kohdalla. Tutkimuksen kohteena on luokitteluvirheen ja korjausmenetelmien vaikutus indeksien estimointiin.
Sekaannusmatriisista nähdään, mihin luokkiin pohjaeläimet kuuluvat ja mihin luokkiin ne on luokiteltu. Tätä tietoa voidaan käyttää luokittelun korjaamiseen aineistoissa, joissa oikeat luokat eivät ole tiedossa. Käyttäjän sekaannusmatriisikorjaus ja tuottajan sekaannusmatriisikorjaus ovat suhteellisen yksinkertaisia menetelmiä, kun taas paras lineaarinen korjaus on mutkikkaampi, lineaarista muunnosta optimoiva menetelmä. Menetelmät korjaavat luokittelun tuloksena saatavia pohjaeläinten taksonomisten ryhmien suhteellisia osuuksia. Näitä korjattuja osuuksia käyttäen voidaan laskea halutut biologiset indeksit.
Korjausten vaikutusta tutkitaan simulointikokeella, joka perustuu aikaisemmin toteutettuun pohjaeläinaineiston koneelliseen luokitteluun. Käyttäjän sekaannusmatriisikorjauksella saadaan lähes harhattomia arvoja pääosin kaikilla indekseillä. Menetelmä toimii myös, vaikka otoskoko olisi pieni ja luokittelija huonohko. Tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus vähentävät indeksien harhaa, mutta eivät niin hyvin kuin käyttäjän korjaus. Kaikki menetelmät eivät kuitenkaan toimi yhtä hyvin, jos sekaannusmatriisi on estimoitu erilaisesta populaatiosta kuin mihin korjausta käytetään. Tällöin paras lineaarinen korjaus on tarkin korjausmenetelmä, muttei kuitenkaan harhaton useimpien indeksien kohdalla. Käyttäjän sekaannusmatriisikorjaus on huonoin korjaus tällaisessa tapauksessa.
Käyttäjän sekaannusmatriisikorjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi. Käyttäjän sekaannusmatriisikorjaus on lähes aina tutkituista menetelmistä paras harhan vähentämiseen ja poistaa parhaimmillaan kokonaan luokittelusta aiheutuvan harhan. Tosin käyttäjän sekaannusmatriisikorjaus toimii erinomaisesti vain, jos sekaannusmatriisi on estimoitu samanlaisesta populaatiosta kuin mitä tutkitaan. Muuten paras lineaarinen korjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi. | fi |
dc.format.extent | 55 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | fi | |
dc.subject.other | sekaannusmatriisi | |
dc.subject.other | sekaannusmatriisikorjaus | |
dc.subject.other | luokittelu | |
dc.subject.other | biologinen indeksi | |
dc.subject.other | pohjaeläin | |
dc.title | Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin | |
dc.identifier.urn | URN:NBN:fi:jyu-201907023517 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Matemaattis-luonnontieteellinen tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Sciences | en |
dc.contributor.laitos | Matematiikan ja tilastotieteen laitos | fi |
dc.contributor.laitos | Department of Mathematics and Statistics | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tilastotiede | fi |
dc.contributor.oppiaine | Statistics | en |
dc.rights.copyright | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights.copyright | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 4043 | |
dc.subject.yso | indeksit | |
dc.subject.yso | korjaus | |
dc.subject.yso | estimointi | |
dc.format.content | fulltext | |
dc.type.okm | G2 | |