dc.contributor.advisor | Mönkölä, Sanna | |
dc.contributor.author | Haaralahti, Elias | |
dc.date.accessioned | 2019-06-05T12:49:43Z | |
dc.date.available | 2019-06-05T12:49:43Z | |
dc.date.issued | 2019 | |
dc.identifier.uri | https://jyx.jyu.fi/handle/123456789/64385 | |
dc.description.abstract | Tässä kirjallisuuskatsauksessa tutustutaan vahvistettuun oppimiseen, joka on koneoppimisen menetelmä. Tavoite on käydä läpi koneoppimisen ja syväoppimisen menetelmiä ja verrata vahvistettua oppimista näihin. Vahvistetussa oppimisessa tutustutaan eri menetelmiin oppia ympäristöiltä ja lopuksi tutustutaan muutamiin vahvistetun oppimisen sovelluksiin. Lopussa todetaan vahvistetun oppimisen olevan hyödyllinen menetelmä ongelmiin, joissa agentti voi oppia ympäristön palautteen avulla. | fi |
dc.description.abstract | In this literature review the topic of reinforcement learning, which is a method of machine learning, will be introduced. The goal is to understand machine learning and deep learning methods and compare them to reinforcement learning methods. Reinforcement learning methods will be explored along a couple of real life applications. The conclusion is that reinforcement learning is a good method for problems, in which an agent can learn from the environment's feedback. | en |
dc.format.extent | 24 | |
dc.language.iso | fi | |
dc.subject.other | vahvistettu oppiminen | |
dc.subject.other | Q-oppiminen | |
dc.title | Vahvistettu oppiminen ja sen sovellukset | |
dc.identifier.urn | URN:NBN:fi:jyu-201906053000 | |
dc.type.ontasot | Bachelor's thesis | en |
dc.type.ontasot | Kandidaatintyö | fi |
dc.contributor.tiedekunta | Informaatioteknologian tiedekunta | fi |
dc.contributor.tiedekunta | Faculty of Information Technology | en |
dc.contributor.laitos | Informaatioteknologia | fi |
dc.contributor.laitos | Information Technology | en |
dc.contributor.yliopisto | Jyväskylän yliopisto | fi |
dc.contributor.yliopisto | University of Jyväskylä | en |
dc.contributor.oppiaine | Tietotekniikka | fi |
dc.contributor.oppiaine | Mathematical Information Technology | en |
dc.rights.copyright | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. | fi |
dc.rights.copyright | This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. | en |
dc.contributor.oppiainekoodi | 602 | |
dc.subject.yso | algoritmit | |
dc.subject.yso | koneoppiminen | |
dc.subject.yso | tekoäly | |
dc.subject.yso | neuroverkot | |