Äänien luokitteleminen neuroverkoilla

Haasiomäki, Mika-Petteri

URN:NBN:fi:jyu-201911295070.pdf

Äänien luokitteleminen neuroverkoilla

Abstract

Äänihavainnon pohjalta suoritettavaa automaattista luokitusta voidaan hyödyntää populaation kehityksen seurannassa tai kiinnostavan lajin tunnistamisessa. Luokittelijan kehittäminen voi olla vaativaa, joten työssä käsitellään koneoppimisen käyttämistä luokittelijan kehityksessä, keskittyen neuroverkkomenetelmiin. Neuroverkot ovat yksi koneoppimisen menetelmä, jossa syöte kuvataan tulokseksi viemällä se verkon laskentayksiköiden läpi. Tutkimuskysymyksenä on laatia tämä luokittelija ja tutkia kuinka sen säädettävät hyperparametrit vaikuttavat luokittelutarkkuuteen. Teoriaosuus koostuu katsauksesta koko luokitusprosessin elementtien teoriaan. Osuudessa käydään läpi äänisignaalista koostuvan aineiston käsittely, segmentointi ja kiinnostavia tapahtumia kuvaavien piirteiden irrotus. Seuraavaksi käydään läpi neuroverkon elementtien teoria, yleisesti käytetyt virhe- ja aktivointifunktiot. Teoriaosuuden loppuosa koostuu neuroverkon opetusprosessin käsittelystä, sen haasteista ja opetusvaiheen optimointimenetelmistä. Normalisointimenetelmien käsittelyssä on painotettu uusimpia menetelmiä kuten ryhmänormalisointia. Tutkimuskysymyksiin haetaan vastausta kokeellisesti viidellä testillä. Empiirinen osassa kuvataan tutkimuksessa toteutettu ympäristö ja käytettävät luokittelijamallit, sekä käytettävä aineisto. Aineiston pohjalta suoritetaan viisi testitapausta, joilla pyritään selvittämään kuinka neuroverkkomalli kannattaa määritellä, kun tavoitteena on minimoida resurssitarve säilyttäen hyväksyttävä luokitustarkkuus. Mallia verrattiin lähimmän naapurin menetelmään perustuvaan luokittelijaan. Luokittelutarkkuuden ja F-mitan tulokset osoittavat, että neuroverkko on tarkempi kuin verrokki lähimmän naapurin menetelmä luokittelija. Tulokset vahvistavat myös ryhmänormalisoinnin merkitystä ja soveltuvuutta neuroverkon opetukseen. Käyttämällä ryhmänormalisointia malli oppi nopeammin ja luokitteli tarkemmin kuin dropout-normalisointia käytettäessä.

Automatic classification based on sound event can be used to track changes in a animal population or to detect specific species in monitoring area. Other uses include reducing needless wireless transmissions in sensing or monitoring networks. An automatic classifier makes a decision to attach a class label by using function, that maps input features to a class label. Development of accurate classifying function may be difficult, therefore in this thesis we aim to use machine learning, focusing on neural networks, to reach this goal. Neural networks are used in machine learning to map from input to output by flowing data through layered network of computational units. In this thesis we take a look at elements of classification process, such as data set handling, noise rejection and segmentation and feature extraction from audio signal. In following chapters, we describe elements of neural networks, common activation and loss functions, training process and associated challenges, as well as regularization and optimization methods used in current networks. Main research question is to implement classifier using neural networks and test impact of various parameters on classification accuracy. Empirical section describes used data set, test cases, environment and implementations. Five tests were conducted with focus to determine parameters for a lightweight neural network, while retaining acceptable classification accuracy. Found model was tested against nearest neighbor classifier, which had access to whole training data set during classification, using 10-fold cross-validation. We found that neural network classifier performed better than nearest neighbor based system with regards to classification accuracy and F-measure score. Additionally results enforce previous results where group normalization yields higher accuracy while converging faster compared to dropout normalization. Our results agree with others on effectiveness of group normalization.

Main Author

Haasiomäki, Mika-Petteri

Format

Theses Master thesis

Published

2019

Subjects

piirreirrotus

äänen luokittelu

eläinten äänet

neuroverkot

koneoppiminen

The permanent address of the publication

https://urn.fi/URN:NBN:fi:jyu-201911295070Use this for linking

Language

Finnish

License

Äänien luokitteleminen neuroverkoilla

Share

Similar Items