University of Jyväskylä | JYX Digital Repository

  • English  | Give feedback |
    • suomi
    • English
 
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
View Item 
  • JYX
  • Opinnäytteet
  • Kandidaatintutkielmat
  • View Item
JYX > Opinnäytteet > Kandidaatintutkielmat > View Item

Vahvistettu oppiminen ja sen sovellukset

Thumbnail
View/Open
190.4 Kb

Downloads:  
Show download detailsHide download details  
Authors
Haaralahti, Elias
Date
2019
Discipline
TietotekniikkaMathematical Information Technology
Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

 
Tässä kirjallisuuskatsauksessa tutustutaan vahvistettuun oppimiseen, joka on koneoppimisen menetelmä. Tavoite on käydä läpi koneoppimisen ja syväoppimisen menetelmiä ja verrata vahvistettua oppimista näihin. Vahvistetussa oppimisessa tutustutaan eri menetelmiin oppia ympäristöiltä ja lopuksi tutustutaan muutamiin vahvistetun oppimisen sovelluksiin. Lopussa todetaan vahvistetun oppimisen olevan hyödyllinen menetelmä ongelmiin, joissa agentti voi oppia ympäristön palautteen avulla.
 
In this literature review the topic of reinforcement learning, which is a method of machine learning, will be introduced. The goal is to understand machine learning and deep learning methods and compare them to reinforcement learning methods. Reinforcement learning methods will be explored along a couple of real life applications. The conclusion is that reinforcement learning is a good method for problems, in which an agent can learn from the environment's feedback.
 
Keywords
vahvistettu oppiminen Q-oppiminen algoritmit koneoppiminen tekoäly neuroverkot
URI

http://urn.fi/URN:NBN:fi:jyu-201906053000

Metadata
Show full item record
Collections
  • Kandidaatintutkielmat [4412]

Related items

Showing items with similar title or keywords.

  • Predicting aircraft arrival times with machine learning 

    Kiesiläinen, Jarno (2020)
    Tässä Pro Gradu -tutkielmassa tutkitaan lentokoneiden matka- ajan ennustamista lentodatan, lentosuunnitelmien, säädatan ja koneoppimisen avulla.
  • Tracking a rat in an open field experiment with a deep learning-based model 

    Kantola, Lauri (2021)
    New artificial neural network methods have changed the way animals are tracked in neuroscience and psychology experiments. The purpose of this thesis is to test the state-of-the-art method of animal tracking DeepLabCut and ...
  • Terveydenhuollon alustat ja tekoäly 

    Vähäkainu, Petri; Neittaanmäki, Pekka (Jyväskylän yliopisto, 2018)
  • IBM-teknologioiden hyödyntäminen terveydenhuollossa 

    Vähäkainu, Petri; Neittaanmäki, Pekka (Jyväskylän yliopisto, 2018)
  • Koneoppiminen rahoitusmarkkinoiden ennustamisessa 

    Leskinen, Jarre (2019)
    Tutkielma käsittelee koneoppimisen soveltuvuutta rahoitusmarkkinoiden ennustamiseen käsitellen erityisesti eri algoritmeja sekä niiden yhdistelmiä ja syötteen optimointia. Tulokset osoittavat, että tehokkaiden markkinoiden ...
  • Browse materials
  • Browse materials
  • Articles
  • Conferences and seminars
  • Electronic books
  • Historical maps
  • Journals
  • Tunes and musical notes
  • Photographs
  • Presentations and posters
  • Publication series
  • Research reports
  • Research data
  • Study materials
  • Theses

Browse

All of JYXCollection listBy Issue DateAuthorsSubjectsPublished inDepartmentDiscipline

My Account

Login

Statistics

View Usage Statistics
  • How to publish in JYX?
  • Self-archiving
  • Publish Your Thesis Online
  • Publishing Your Dissertation
  • Publication services

Open Science at the JYU
 
Data Protection Description

Accessibility Statement

Unless otherwise specified, publicly available JYX metadata (excluding abstracts) may be freely reused under the CC0 waiver.
Open Science Centre