Fast Poisson solvers for graphics processing units
Myllykoski, M., Rossi, T., & Toivanen, J. (2013). Fast Poisson solvers for graphics processing units. In P. Manninen, & P. Öster (Eds.), Applied Parallel and Scientific Computing: 11th International Conference, PARA 2012, Helsinki, Finland, June 10-13, 2012, Revised Selected Papers (pp. 265-279). Springer. Lecture Notes in Computer Science, 7782. https://doi.org/10.1007/978-3-642-36803-5_19
Julkaistu sarjassa
Lecture Notes in Computer SciencePäivämäärä
2013Tekijänoikeudet
© Springer-Verlag Berlin Heidelberg 2013. This is a final draft version of an article whose final and definitive form has been published by Springer. Published in this repository with the kind permission of the publisher.
Two block cyclic reduction linear system solvers are considered
and implemented using the OpenCL framework. The topics of
interest include a simplified scalar cyclic reduction tridiagonal system
solver and the impact of increasing the radix-number of the algorithm.
Both implementations are tested for the Poisson problem in two and
three dimensions, using a Nvidia GTX 580 series GPU and double precision
floating-point arithmetic. The numerical results indicate up to 6-fold
speed increase in the case of the two-dimensional problems and up to 3-
fold speed increase in the case of the three-dimensional problems when
compared to equivalent CPU implementations run on a Intel Core i7
quad-core CPU.
Julkaisija
SpringerISBN
978-3-642-36803-5Emojulkaisun ISBN
Konferenssi
International Conference on Applied Parallel and Scientific ComputingKuuluu julkaisuun
Applied Parallel and Scientific Computing: 11th International Conference, PARA 2012, Helsinki, Finland, June 10-13, 2012, Revised Selected PapersISSN Hae Julkaisufoorumista
0302-9743Asiasanat
Julkaisu tutkimustietojärjestelmässä
https://converis.jyu.fi/converis/portal/detail/Publication/22166912
Metadata
Näytä kaikki kuvailutiedotKokoelmat
Samankaltainen aineisto
Näytetään aineistoja, joilla on samankaltainen nimeke tai asiasanat.
-
A parallel radix-4 block cyclic reduction algorithm
Myllykoski, Mirko; Rossi, Tuomo (John Wiley & Sons Ltd., 2014)A conventional block cyclic reduction algorithm operates by halving the size of the linear system at each reduction step, that is, the algorithm is a radix-2 method. An algorithm analogous to the block cyclic reduction ... -
On GPU-accelerated fast direct solvers and their applications in image denoising
Myllykoski, Mirko (University of Jyväskylä, 2015) -
Poissonin yhtälön nopeat ratkaisijat
Jauhiainen, Susanne (2016)Tutkielmassa esitellään Poissonin yhtälö sekä sen diskretointi. Lisäksi käydään läpi kaksi nopeaa numeerista menetelmää yhtälön ratkaisemiseksi. Yksinkertaisuuden vuoksi rajoitutaan kaksiulotteisiin tehtäviin, joissa on ... -
Designing a graphics processing unit accelerated petaflop capable lattice Boltzmann solver: Read aligned data layouts and asynchronous communication
Robertsén, Fredrik; Westerholm, Jan; Mattila, Keijo (Sage, 2017)The lattice Boltzmann method is a well-established numerical approach for complex fluid flow simulations. Recently, general-purpose graphics processing units (GPUs) have become available as high-performance computing ... -
DNA computing
Lappalainen, Panu (2019)Tässä kirjallisuuskatsauksessa käsitellään DNA:n mahdollisuuksia tietokonelaskennassa. DNA on erinomainen rinnakkaislaskennassa laskentanopeutensa ja energiatehokkuutensa puolesta, mutta sen hitaan valmisteluajan ja yleisen ...
Ellei toisin mainittu, julkisesti saatavilla olevia JYX-metatietoja (poislukien tiivistelmät) saa vapaasti uudelleenkäyttää CC0-lisenssillä.