AlphaZero shakkikoneena

Pitkänen, Jonni

Katso/Avaa

1.0 Mb

Lataukset:

Show download details Hide download details

Tekijät

Pitkänen, Jonni

Päivämäärä

2019

Oppiaine

Tietotekniikka Mathematical Information Technology

DeepMindin koneoppiva go:ta, shogia ja shakkia pelaava AlphaZero yllätti shakkimaailman vuoden 2017 lopussa omalaatuisella ihmisläheisellä pelityylillään ja kiistattomalla tehokkuudellaan. Tässä tutkielmassa haluttiin selvittää AlphaZeron rakennetta sekä sen taustalla olevia menetelmiä. Syy AlphaZeron menestykseen todettiin olevan sen ihmisistä riippumaton syvä vahvistettu oppiminen, sekä lupaaviin variaatioihin keskittyvä Monte-Carlo -puuhaku. Tiedon pohjalta pääteltiin, että AlphaZeron pelitilanteita analysoiva neuroverkko sekä liikkeitä etsivä puuhaku vastaavat yllättävän tarkasti perinteisten shakkikoneiden kaksiosaista mallia, mutta kummankin osan toteutus vaikuttaa olevan perinteisiä funktioita tehokkaampi.

The world of chess was surprised in late 2017 by DeepMind's machine learning go-, shogi- and chess engine AlphaZero with it's unique human-like playstyle and it's undisputed efficiency. The objective of this thesis was to study the structure of AlphaZero and the methods used to complement it. According to the information gathered, the key to AlphaZero's success was it's human-independent deep reinforcement learning and it's Monte-Carlo Tree Search, that is able to concentrate on more promising variations. From these finds it was derived, that structure-wise AlphaZero resembles the traditional chess engine surprisingly well, but it seems AlphaZero's components are more effective in their tasks.

Lisenssi