GPU-laskennan optimointi
Näytönohjaimet, grafiikkasuorittimet, tarjoavat rinnakkaisen laskennan alustan,
jossa voidaan suorittaa ohjelmakoodia satojen ydinten toimesta. Tämä alusta mahdollistaa
matemaattisesti työläiden ongelmien ratkaisemisen tehokkaasti. Grafiikkasuorittimen
rinnakkainen suoritusympäristö kuitenkin eroaa suuresti tietokoneen suorittimen peräkkäisestä
suoritusympäristöstä. Ongelmien ratkaisemiseksi tehokkaasti rinnakkaisympäristössä
on noudettava ohjelmointimenetelmiä, jotka soveltuvat erityisesti rinnakkaisympäristöön.
Tässä työssä tarkastellaan rinnakkaisen laskennan perusteita, miten erilaiset ohjelmointimenetelmät
vaikuttavat ohjelman suoriutumiseen grafiikkasuorittimella sekä miten voidaan
saavuttaa nopein mahdollinen suoritusaika ohjelmalle grafiikkasuorittimella. Työssä laadittiin
teoreettinen parametroitu malli grafiikkasuorittimen laskenta-ajan arviointiin. Lisäksi
toteutettiin kaksi erilaista matriisikertolaskuja suorittavaa rinnakkaisen laskennan ohjelmaa.
Työn tuloksissa verrataan teoreettista suoritusaika-arviota käytännössä saavutettuihin
tuloksiin sekä esitetään grafiikkasuorittimella suoritettavilla ohjelmilla saavutettuja nopeutuksia
eri parametriarvoilla.
...
Graphics processing units offer platform that consist of hundreds of cores for
programs to use in parallel computing. This platform can be used to solve efficiently mathematically
heavy problems. Running programs in parallel computing environment differs from running programs in serial environment. In order to achieve speedup from parallel environment, programmer must use programming methods suitable to parallel environment. In this work we explain some basics of parallel computing and examine how pro-gramming and optimization practices affect programs running in graphics processing unit. We also created our own theoretical parameterized model which is used to estimate performance of our GPU-programs. Our model is used to estimate performance of two different matrix multiplication programs, which are run in parallel environment. In results we compare theoretical performance values, calculated by using our own model, to ones measured in real run environment. Also we present how different parameters affect to gained speedup when using our GPU-programs.
...
Asiasanat
Metadata
Näytä kaikki kuvailutiedotKokoelmat
- Pro gradu -tutkielmat [29740]
Lisenssi
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
Parallel global optimization : structuring populations in differential evolution
Weber, Matthieu (University of Jyväskylä, 2010) -
Fast Poisson solvers for graphics processing units
Myllykoski, Mirko; Rossi, Tuomo; Toivanen, Jari (Springer, 2013)Two block cyclic reduction linear system solvers are considered and implemented using the OpenCL framework. The topics of interest include a simplified scalar cyclic reduction tridiagonal system solver and the impact ... -
A Study on the Assessment of Introductory Computational Thinking via Scratch Programming in Primary Schools
Fagerlund, Janne (ACM, 2018)Computational thinking (CT), a transversal intellectual foundation integral to computer science, is making its way into compulsory comprehensive education worldwide. Students are expected to attain skills and knowledge ... -
On GPU-accelerated fast direct solvers and their applications in image denoising
Myllykoski, Mirko (University of Jyväskylä, 2015) -
Potential and challenges in home care service process optimization : a route optimization approach
Nakari, Pentti J. E. (University of Jyväskylä, 2016)Aging of the population is an increasing problem in many countries, including Finland, and it poses a challenge to public services such as home care. Vehicle routing optimization (VRP) type optimization solutions are one ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.