dc.contributor.advisor | Neittaanmäki, Pekka | |
dc.contributor.advisor | Äyrämö, Sami | |
dc.contributor.author | Zeeshan, Khaula | |
dc.date.accessioned | 2018-08-21T10:08:40Z | |
dc.date.available | 2018-08-21T10:08:40Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/59287 | |
dc.description.abstract | Syvä oppiminen (engl. deep learning) on viime aikoina tullut suosituimmaksi koneoppimisen menetelmäksi. Konvoluutio(hermo)verkko on yksi suosituimmista syvän oppimisen arkkitehtuureista monimutkaisiin ongelmiin kuten kuvien luokitteluun, tunnistukseen ja havaitsemiseen. Syvän oppimisen menetelmien toimivuutta haittaa kuitenkin ylisovittumisongelma. Koska konvoluutioverkot ovat konenäössä tehokkaita, täytyy niiden ylisovittumisen välttämiseksi kehittää uusia menetelmiä. Tämä tutkielma tarjoaa katsauksen lähiaikoina kehitettyihin regularisointimenetelmiin konvoluutioverkkojen ja muiden syvän oppimisen menetelmien tarpeisiin. Tutkielmassa verrataan yleisimmin käytettyjä regularisointimenetelmiä (dropout, batch normalization sekä kernel -regularisointi) kouluttamalla konvoluutioverkko kuvien luokitteluun kahdelle aineistolle (CIFAR-10 ja Kagglen kissa/koira -aineisto). Mallit validoidaan 10-ositetulla ristiinvalidoinnilla. Empiiriset tulokset varmistavat, että dropout-menettely on muihin kokeiltuihin verrattuna vahva tekniikka
molempien aineistojen kohdalla | fi |
dc.description.abstract | Deep learning has become the most popular class of machine learning family in
recent times. Convolutional neural networks is one of the most popular deep learning architecture for solving many complicated and sophisticated problems like image classification,
image recognition, and image detection. However, deep learning techniques faces overfitting
problems, which is a hindrance to the model performance. Since convolutional neural networks are outperforming in the field of computer vision, so the need for new regularization
techniques to reduce overfitting issues in convolutional neural networks is inevitable. This
thesis work provides a peek into the recently developed regularization methods particularly
for convolutional neural networks and generally for other deep learning techniques. This thesis also showcases the comparison of most commonly used regularization methods (dropout,
batch normalization, kernel regularization) by training convolutional neural networks for image classification on two image datasets (CIFAR-10 and Kaggle‘s Cat vs Dog). Each model
is cross validated by 10- fold cross validation. Empirical results confirms that dropout is a
strong regularization technique as compared to the other two methods( batch normalization
and L1 and L2 regularization) on both datasets. | en |
dc.format.extent | 63 | |
dc.format.mimetype | application/pdf | |
dc.language.iso | en | |
dc.subject.other | artificial intelligence | |
dc.subject.other | machine learning | |
dc.subject.other | deep learning | |
dc.subject.other | convolutional neural network | |
dc.subject.other | image classification | |
dc.subject.other | regularization | |
dc.subject.other | k-fold cross validation | |
dc.subject.other | dropout | |
dc.subject.other | batch normalization | |
dc.subject.other | kernel regularization | |
dc.title | The Impact of Regularization on Convolutional Neural Networks | |
dc.identifier.urn | URN:NBN:fi:jyu-201808213890 | |
dc.type.ontasot | Pro gradu -tutkielma | fi |
dc.type.ontasot | Master’s thesis | en |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietotekniikka | fi |
dc.contributor.oppiaine | Mathematical Information Technology | en |
dc.rights.copyright | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights.copyright | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.type.publication | masterThesis | |
dc.contributor.oppiainekoodi | 602 | |
dc.subject.yso | koneoppiminen | |
dc.subject.yso | datatiede | |
dc.subject.yso | data | |
dc.subject.yso | mallit (tuotokset) | |
dc.subject.yso | analyysi | |
dc.subject.yso | machine learning | |
dc.subject.yso | data science | |
dc.subject.yso | data | |
dc.subject.yso | models (objects) | |
dc.subject.yso | analysis | |
dc.format.content | fulltext | |
dc.type.okm | G2 | |