Show simple item record

dc.contributor.advisorNeittaanmäki, Pekka
dc.contributor.advisorÄyrämö, Sami
dc.contributor.authorZeeshan, Khaula
dc.date.accessioned2018-08-21T10:08:40Z
dc.date.available2018-08-21T10:08:40Z
dc.date.issued2018
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/59287
dc.description.abstractSyvä oppiminen (engl. deep learning) on viime aikoina tullut suosituimmaksi koneoppimisen menetelmäksi. Konvoluutio(hermo)verkko on yksi suosituimmista syvän oppimisen arkkitehtuureista monimutkaisiin ongelmiin kuten kuvien luokitteluun, tunnistukseen ja havaitsemiseen. Syvän oppimisen menetelmien toimivuutta haittaa kuitenkin ylisovittumisongelma. Koska konvoluutioverkot ovat konenäössä tehokkaita, täytyy niiden ylisovittumisen välttämiseksi kehittää uusia menetelmiä. Tämä tutkielma tarjoaa katsauksen lähiaikoina kehitettyihin regularisointimenetelmiin konvoluutioverkkojen ja muiden syvän oppimisen menetelmien tarpeisiin. Tutkielmassa verrataan yleisimmin käytettyjä regularisointimenetelmiä (dropout, batch normalization sekä kernel -regularisointi) kouluttamalla konvoluutioverkko kuvien luokitteluun kahdelle aineistolle (CIFAR-10 ja Kagglen kissa/koira -aineisto). Mallit validoidaan 10-ositetulla ristiinvalidoinnilla. Empiiriset tulokset varmistavat, että dropout-menettely on muihin kokeiltuihin verrattuna vahva tekniikka molempien aineistojen kohdallafi
dc.description.abstractDeep learning has become the most popular class of machine learning family in recent times. Convolutional neural networks is one of the most popular deep learning architecture for solving many complicated and sophisticated problems like image classification, image recognition, and image detection. However, deep learning techniques faces overfitting problems, which is a hindrance to the model performance. Since convolutional neural networks are outperforming in the field of computer vision, so the need for new regularization techniques to reduce overfitting issues in convolutional neural networks is inevitable. This thesis work provides a peek into the recently developed regularization methods particularly for convolutional neural networks and generally for other deep learning techniques. This thesis also showcases the comparison of most commonly used regularization methods (dropout, batch normalization, kernel regularization) by training convolutional neural networks for image classification on two image datasets (CIFAR-10 and Kaggle‘s Cat vs Dog). Each model is cross validated by 10- fold cross validation. Empirical results confirms that dropout is a strong regularization technique as compared to the other two methods( batch normalization and L1 and L2 regularization) on both datasets.en
dc.format.extent63
dc.format.mimetypeapplication/pdf
dc.language.isoen
dc.subject.otherartificial intelligence
dc.subject.othermachine learning
dc.subject.otherdeep learning
dc.subject.otherconvolutional neural network
dc.subject.otherimage classification
dc.subject.otherregularization
dc.subject.otherk-fold cross validation
dc.subject.otherdropout
dc.subject.otherbatch normalization
dc.subject.otherkernel regularization
dc.titleThe Impact of Regularization on Convolutional Neural Networks
dc.identifier.urnURN:NBN:fi:jyu-201808213890
dc.type.ontasotPro gradu -tutkielmafi
dc.type.ontasotMaster’s thesisen
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosInformaatioteknologiafi
dc.contributor.laitosInformation Technologyen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.oppiaineTietotekniikkafi
dc.contributor.oppiaineMathematical Information Technologyen
dc.rights.copyrightJulkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.fi
dc.rights.copyrightThis publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.en
dc.type.publicationmasterThesis
dc.contributor.oppiainekoodi602
dc.subject.ysokoneoppiminen
dc.subject.ysodatatiede
dc.subject.ysodata
dc.subject.ysomallit (tuotokset)
dc.subject.ysoanalyysi
dc.subject.ysomachine learning
dc.subject.ysodata science
dc.subject.ysodata
dc.subject.ysomodels (objects)
dc.subject.ysoanalysis
dc.format.contentfulltext
dc.type.okmG2


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record