University of Jyväskylä | JYX Digital Repository

  • English  | Give feedback |
    • suomi
    • English
 
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
View Item 
  • JYX
  • Opinnäytteet
  • Kandidaatintutkielmat
  • View Item
JYX > Opinnäytteet > Kandidaatintutkielmat > View Item

MuZero ja mallipohjainen vahvistusoppiminen

Thumbnail
View/Open
366.2 Kb

Downloads:  
Show download detailsHide download details  
Authors
Leinonen, Hertta
Date
2021
Discipline
TietotekniikkaMathematical Information Technology
Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

 
Tutkielmassa pyritään selvittämään, mitä mallipohjainen vahvistusoppiminen tarkoittaa, ja kuinka sitä hyödynnetään MuZero-nimisen tekoälyn algoritmissa. MuZeroa on testattu menestyksekkäästi sekä klassisissa lautapeleissä, että visuaalisesti monimutkaisissa Atari –peleissä. MuZero yhdistää toiminnassaan syvän mallipohjaisen vahvistusoppimisen, sekä Monte Carlo -puuhaun, saavuttaen kyvyn suoriutua keskenään hyvin erilaisista peleistä tuntematta niiden sääntöjä entuudestaan.
 
The aim of this thesis is to find out what model-based reinforcement learning is and how it is utilized in MuZero’s algorithm. MuZero has been successfully tested in both classic board games and visually complex Atari games. MuZero combines deep model-based reinforcement learning with Monte Carlo tree search, achieving the ability to play different games without knowing their rules.
 
Keywords
MuZero syväoppiminen mallipohjainen vahvistusoppiminen Monte Carlo -puuhaku DeepMind tekoäly algoritmit Monte Carlo -menetelmät tietotekniikka pelit koneoppiminen lautapelit
URI

http://urn.fi/URN:NBN:fi:jyu-202105122744

Metadata
Show full item record
Collections
  • Kandidaatintutkielmat [4165]

Related items

Showing items with similar title or keywords.

  • Between- and within-day repeatability of markerless 2D motion analysis using deep neural networks 

    Romppanen, Vesa (2021)
    The purpose of this study was to evaluate kinematic analysis repeatability by deep learning approach in countermovement jump. Seventy athletes (39 women, 31 men) performed two maximal countermovement jumps in either one ...
  • Tekoälyn hyödyntäminen yritysten markkinoinnissa 

    Mustamäki, Miika (2021)
    Tässä kandidaatintutkielmassa tutkitaan, kuinka tekoälyä voidaan hyödyntää yritysten markkinoinnissa. Tekoäly on ottanut suuria kehitysaskeleita viime vuosina, joten myös sen käyttö on yleistynyt ympärillämme ja myös ...
  • Tracking a rat in an open field experiment with a deep learning-based model 

    Kantola, Lauri (2021)
    New artificial neural network methods have changed the way animals are tracked in neuroscience and psychology experiments. The purpose of this thesis is to test the state-of-the-art method of animal tracking DeepLabCut and ...
  • Radiosignaalien tunnistaminen neuroverkon avulla 

    Colliander, Jeremias (2022)
    Tekoäly on kehittynyt viime vuosina huimaa tahtia ja sitä on alettu soveltaa uusien haasteiden ratkaisemiseksi. Yksi tällainen haaste on pitkään ollut useiden radiosignaalien luokittelu toisistaan riittävällä tarkkuudella. ...
  • Explainable AI for Industry 4.0 : Semantic Representation of Deep Learning Models 

    Terziyan, Vagan; Vitko, Oleksandra (Elsevier, 2022)
    Artificial Intelligence is an important asset of Industry 4.0. Current discoveries within machine learning and particularly in deep learning enable qualitative change within the industrial processes, applications, systems ...
  • Browse materials
  • Browse materials
  • Articles
  • Conferences and seminars
  • Electronic books
  • Historical maps
  • Journals
  • Tunes and musical notes
  • Photographs
  • Presentations and posters
  • Publication series
  • Research reports
  • Research data
  • Study materials
  • Theses

Browse

All of JYXCollection listBy Issue DateAuthorsSubjectsPublished inDepartmentDiscipline

My Account

Login

Statistics

View Usage Statistics
  • How to publish in JYX?
  • Self-archiving
  • Publish Your Thesis Online
  • Publishing Your Dissertation
  • Publication services

Open Science at the JYU
 
Data Protection Description

Accessibility Statement

Unless otherwise specified, publicly available JYX metadata (excluding abstracts) may be freely reused under the CC0 waiver.
Open Science Centre