Äänien luokitteleminen neuroverkoilla
Tekijät
Päivämäärä
2019Tekijänoikeudet
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Äänihavainnon pohjalta suoritettavaa automaattista luokitusta voidaan hyödyntää populaation kehityksen seurannassa tai kiinnostavan lajin tunnistamisessa. Luokittelijan kehittäminen voi olla vaativaa, joten työssä käsitellään koneoppimisen käyttämistä luokittelijan kehityksessä, keskittyen neuroverkkomenetelmiin. Neuroverkot ovat yksi koneoppimisen menetelmä, jossa syöte kuvataan tulokseksi viemällä se verkon laskentayksiköiden läpi. Tutkimuskysymyksenä on laatia tämä luokittelija ja tutkia kuinka sen säädettävät hyperparametrit vaikuttavat luokittelutarkkuuteen.
Teoriaosuus koostuu katsauksesta koko luokitusprosessin elementtien teoriaan. Osuudessa käydään läpi äänisignaalista koostuvan aineiston käsittely, segmentointi ja kiinnostavia tapahtumia kuvaavien piirteiden irrotus. Seuraavaksi käydään läpi neuroverkon elementtien teoria, yleisesti käytetyt virhe- ja aktivointifunktiot. Teoriaosuuden loppuosa koostuu neuroverkon opetusprosessin käsittelystä, sen haasteista ja opetusvaiheen optimointimenetelmistä. Normalisointimenetelmien käsittelyssä on painotettu uusimpia menetelmiä kuten ryhmänormalisointia.
Tutkimuskysymyksiin haetaan vastausta kokeellisesti viidellä testillä. Empiirinen osassa kuvataan tutkimuksessa toteutettu ympäristö ja käytettävät luokittelijamallit, sekä käytettävä aineisto. Aineiston pohjalta suoritetaan viisi testitapausta, joilla pyritään selvittämään kuinka neuroverkkomalli kannattaa määritellä, kun tavoitteena on minimoida resurssitarve säilyttäen hyväksyttävä luokitustarkkuus. Mallia verrattiin lähimmän naapurin menetelmään perustuvaan luokittelijaan.
Luokittelutarkkuuden ja F-mitan tulokset osoittavat, että neuroverkko on tarkempi kuin verrokki lähimmän naapurin menetelmä luokittelija. Tulokset vahvistavat myös ryhmänormalisoinnin merkitystä ja soveltuvuutta neuroverkon opetukseen. Käyttämällä ryhmänormalisointia malli oppi nopeammin ja luokitteli tarkemmin kuin dropout-normalisointia käytettäessä.
...
Automatic classification based on sound event can be used to track changes in a animal population or to detect specific species in monitoring area. Other uses include reducing needless wireless transmissions in sensing or monitoring networks. An automatic classifier makes a decision to attach a class label by using function, that maps input features to a class label. Development of accurate classifying function may be difficult, therefore in this thesis we aim to use machine learning, focusing on neural networks, to reach this goal. Neural networks are used in machine learning to map from input to output by flowing data through layered network of computational units.
In this thesis we take a look at elements of classification process, such as data set handling, noise rejection and segmentation and feature extraction from audio signal. In following chapters, we describe elements of neural networks, common activation and loss functions, training process and associated challenges, as well as regularization and optimization methods used in current networks. Main research question is to implement classifier using neural networks and test impact of various parameters on classification accuracy.
Empirical section describes used data set, test cases, environment and implementations. Five tests were conducted with focus to determine parameters for a lightweight neural network, while retaining acceptable classification accuracy. Found model was tested against nearest neighbor classifier, which had access to whole training data set during classification, using 10-fold cross-validation. We found that neural network classifier performed better than nearest neighbor based system with regards to classification accuracy and F-measure score. Additionally results enforce previous results where group normalization yields higher accuracy while converging faster compared to dropout normalization. Our results agree with others on effectiveness of group normalization.
...
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29542]
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Aimbottien havaitseminen keinotekoisilla neuroverkoilla
Kahilainen, Niko (2023)FPS-peleissä aimbottien käyttäjillä on epäreilu etu suhteessa rehellisiin pelaajiin, mutta huijausohjelmien käytön havaitseminen perinteisin keinoin on jatkuvaa kissa ja hiiri -leikkiä. Ratkaisuksi tähän on usein ehdotettu ... -
Radiosignaalien tunnistaminen neuroverkon avulla
Colliander, Jeremias (2022)Tekoäly on kehittynyt viime vuosina huimaa tahtia ja sitä on alettu soveltaa uusien haasteiden ratkaisemiseksi. Yksi tällainen haaste on pitkään ollut useiden radiosignaalien luokittelu toisistaan riittävällä tarkkuudella. ... -
Domain‐specific neural networks improve automated bird sound recognition already with small amount of local data
Lauha, Patrik; Somervuo, Panu; Lehikoinen, Petteri; Geres, Lisa; Richter, Tobias; Seibold, Sebastian; Ovaskainen, Otso (Wiley-Blackwell, 2022)An automatic bird sound recognition system is a useful tool for collecting data of different bird species for ecological analysis. Together with autonomous recording units (ARUs), such a system provides a possibility to ... -
Puhujariippuvainen puhekomentojentunnistus neuroverkoilla
Nummelin, Panu (2021)Tässä tutkimuksessa etsittiin puhekomennontunnistusmallia, joka voitaisiin kouluttaa pienellä määrällä äänitteitä tunnistamaan muutamia ennalta määrättyjä tietyn henkilön komentoja. Kolmea puhujariippuvaisella datalla ... -
Rytmihäiriöiden havaitseminen sydänsähkökäyrästä neuroverkoilla
Kurkinen, Laura (2019)Tässä kandidaatintutkielmassa perehdytään rytmihäiriöiden havaitsemiseen sydänsähkökäyrästä neuroverkkojen avulla. Tietokoneavusteisella sydänsähkökäyrän käsittelyllä voidaan tehostaa tulkintaprosessia ja saada objektiivisempia ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.