Näytä suppeat kuvailutiedot

dc.contributor.advisorAnnala, Leevi
dc.contributor.authorLeinonen, Hertta
dc.date.accessioned2021-05-12T05:51:42Z
dc.date.available2021-05-12T05:51:42Z
dc.date.issued2021
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/75464
dc.description.abstractTutkielmassa pyritään selvittämään, mitä mallipohjainen vahvistusoppiminen tarkoittaa, ja kuinka sitä hyödynnetään MuZero-nimisen tekoälyn algoritmissa. MuZeroa on testattu menestyksekkäästi sekä klassisissa lautapeleissä, että visuaalisesti monimutkaisissa Atari –peleissä. MuZero yhdistää toiminnassaan syvän mallipohjaisen vahvistusoppimisen, sekä Monte Carlo -puuhaun, saavuttaen kyvyn suoriutua keskenään hyvin erilaisista peleistä tuntematta niiden sääntöjä entuudestaan.fi
dc.description.abstractThe aim of this thesis is to find out what model-based reinforcement learning is and how it is utilized in MuZero’s algorithm. MuZero has been successfully tested in both classic board games and visually complex Atari games. MuZero combines deep model-based reinforcement learning with Monte Carlo tree search, achieving the ability to play different games without knowing their rules.en
dc.format.extent26
dc.language.isofi
dc.subject.otherMuZero
dc.subject.othersyväoppiminen
dc.subject.othermallipohjainen vahvistusoppiminen
dc.subject.otherMonte Carlo -puuhaku
dc.subject.otherDeepMind
dc.titleMuZero ja mallipohjainen vahvistusoppiminen
dc.identifier.urnURN:NBN:fi:jyu-202105122744
dc.type.ontasotBachelor's thesisen
dc.type.ontasotKandidaatintyöfi
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosInformaatioteknologiafi
dc.contributor.laitosInformation Technologyen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.oppiaineTietotekniikkafi
dc.contributor.oppiaineMathematical Information Technologyen
dc.rights.copyrightJulkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.fi
dc.rights.copyrightThis publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.en
dc.contributor.oppiainekoodi602
dc.subject.ysotekoäly
dc.subject.ysoalgoritmit
dc.subject.ysoMonte Carlo -menetelmät
dc.subject.ysotietotekniikka
dc.subject.ysopelit
dc.subject.ysokoneoppiminen
dc.subject.ysolautapelit


Aineistoon kuuluvat tiedostot

Thumbnail

Aineisto kuuluu seuraaviin kokoelmiin

Näytä suppeat kuvailutiedot