MuZero ja mallipohjainen vahvistusoppiminen
Authors
Date
2021Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Tutkielmassa pyritään selvittämään, mitä mallipohjainen vahvistusoppiminen tarkoittaa, ja kuinka sitä hyödynnetään MuZero-nimisen tekoälyn algoritmissa. MuZeroa on testattu menestyksekkäästi sekä klassisissa lautapeleissä, että visuaalisesti monimutkaisissa Atari –peleissä. MuZero yhdistää toiminnassaan syvän mallipohjaisen vahvistusoppimisen, sekä Monte Carlo -puuhaun, saavuttaen kyvyn suoriutua keskenään hyvin erilaisista peleistä tuntematta niiden sääntöjä entuudestaan. The aim of this thesis is to find out what model-based reinforcement learning is and how it is utilized in MuZero’s algorithm. MuZero has been successfully tested in both classic board games and visually complex Atari games. MuZero combines deep model-based reinforcement learning with Monte Carlo tree search, achieving the ability to play different games without knowing their rules.
Keywords
Metadata
Show full item recordCollections
- Kandidaatintutkielmat [4165]
Related items
Showing items with similar title or keywords.
-
Between- and within-day repeatability of markerless 2D motion analysis using deep neural networks
Romppanen, Vesa (2021)The purpose of this study was to evaluate kinematic analysis repeatability by deep learning approach in countermovement jump. Seventy athletes (39 women, 31 men) performed two maximal countermovement jumps in either one ... -
Tekoälyn hyödyntäminen yritysten markkinoinnissa
Mustamäki, Miika (2021)Tässä kandidaatintutkielmassa tutkitaan, kuinka tekoälyä voidaan hyödyntää yritysten markkinoinnissa. Tekoäly on ottanut suuria kehitysaskeleita viime vuosina, joten myös sen käyttö on yleistynyt ympärillämme ja myös ... -
Tracking a rat in an open field experiment with a deep learning-based model
Kantola, Lauri (2021)New artificial neural network methods have changed the way animals are tracked in neuroscience and psychology experiments. The purpose of this thesis is to test the state-of-the-art method of animal tracking DeepLabCut and ... -
Radiosignaalien tunnistaminen neuroverkon avulla
Colliander, Jeremias (2022)Tekoäly on kehittynyt viime vuosina huimaa tahtia ja sitä on alettu soveltaa uusien haasteiden ratkaisemiseksi. Yksi tällainen haaste on pitkään ollut useiden radiosignaalien luokittelu toisistaan riittävällä tarkkuudella. ... -
Explainable AI for Industry 4.0 : Semantic Representation of Deep Learning Models
Terziyan, Vagan; Vitko, Oleksandra (Elsevier, 2022)Artificial Intelligence is an important asset of Industry 4.0. Current discoveries within machine learning and particularly in deep learning enable qualitative change within the industrial processes, applications, systems ...