University of Jyväskylä | JYX Digital Repository

  • English  | Give feedback |
    • suomi
    • English
 
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.
View Item 
  • JYX
  • Opinnäytteet
  • Pro gradu -tutkielmat
  • View Item
JYX > Opinnäytteet > Pro gradu -tutkielmat > View Item

Comparative analysis of data stream processing systems

Thumbnail
View/Open
426.7 Kb

Downloads:  
Show download detailsHide download details  
Authors
Zeb, Mian Shah
Date
2020
Discipline
TietojenkäsittelytiedeComputer Science
Copyright
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

 
Big data-käsittelyjärjestelmät ovat tällä hetkellä kehittymässä stream-orientoituneiksi, eli data käsitellään heti saapuessaan. Perinteisemmin data säilöttiin tietokantaan, tiedostopohjaisesti tai muuhun tiedonsäilytysjärjestelmään, ja applikaatiot hakivat datan tarvittaessa. Stream-pohjainen järjestelmä käsittelee liikkuvaa dataa, jatkuva-aikaista dataa useasta lähteestä. Sen sijaan, että haetaan ajoittain dataa, stream-pohjaiset frameworkit pystyvät käsittelemään dataa heti kun se on saatavilla, täten vähentäen viivettä. Tässä tutkielmassa tehdään komparatiivinen analyysi eri stream-pohjaisten frameworkien välillä, perustuen valittuihin ominaisuuksiin. Tutkittavat frameworkit ovat Apache Samza, Apache Flink, Apache Storm ja Apache Spark Structured Streaming. Tutkielmassa perehdytään myös Apache Kafkaan, joka on lokiperusteinen tietovarasto, jota laajalti käytetään stream-pohjaisissa frameworkeissa.
 
Big data processing systems are evolving to be more stream oriented where data is processed continuously by processing it as soon as it arrives. Earlier data was often stored in a database, a file system or other form of data storage system. Applications would query the data as needed. Stram processing is the processing of data in motion. It works on continuous data retrieved from different resources. Instead of periodically collecting huge static data, streaming frameworks process data as soon as it becomes available, hence reducing latency. This thesis aims to conduct a comparative analysis of different streaming processors based on selected features. Research focuses on Apache Samza, Apache Flink, Apache Storm and Apache Spark Structured Streaming. Also, this thesis explains Apache Kafka which is a log-based data storage widely used in streaming frameworks.
 
Keywords
Stream Processing Batch Processing Apache Kafka Apache Samza Streaming Engines tietojenkäsittely big data tietojärjestelmät tietotekniikka data suoratoisto data processing data systems information technology streaming
URI

http://urn.fi/URN:NBN:fi:jyu-202002242154

Metadata
Show full item record
Collections
  • Pro gradu -tutkielmat [24531]

Related items

Showing items with similar title or keywords.

  • Information Technology–Supported value Co-Creation and Co-Destruction via social interaction and resource integration in service systems 

    Li, Mengcheng; Tuunanen, Tuure (Elsevier BV, 2022)
    The paper develops a conceptual framework to study the constructs of information technology (IT)-supported value co-creation and co-destruction through shared processes of social interaction and resource integration as ...
  • The determinants affecting on the investment proposals adoption 

    Hirvonen, Pauliina (2016)
    Tietoturvallisuuden tutkimuksessa ei ole kyetty tunnistamaan tekijöitä, jotka vaikuttavat tietoturvallisuusaloitteiden onnistumiseen. Teoreettinen tutkimus lähestyy haastetta tarkastelemalla olemassa olevia tietotekniikan ...
  • The use of Electronic Information Systems in social work : A scoping review of the empirical articles published between 2000 and 2019 

    Ylönen, Katri (Routledge, 2022)
    Sähköisiä tietojärjestelmiä käytetään laajasti sosiaalityössä, mutta empiirisiä tutkimustuloksia niiden käytöstä ei ole vielä analysoitu ja levitetty. Tässä kartoittavassa kirjallisuuskatsauksessa tarkasteltiin vuosien ...
  • Information Systems Students’ Impressions on Learning Modeling Enterprise Architectures 

    Seppanen,Ville; Pulkkinen, Mirja; Taipalus, Toni; Nurmi, Jarkko (IEEE, 2020)
    This Full Research Paper presents enterprise architecture (EA) modeling tools utilized in an educational context. EA is a well-known and a commonly used approach for organizational development aiming to improve the alignment ...
  • Interdisciplinary perceptions on comparing systems analysis and design to the practices of digital service design 

    Ollila, Markus (2022)
    Tässä Pro gradu -tutkielmassa syvennytään tunnistamaan yhteneväisyyksiä tietojärjestelmäkehityksen järjestelmäanalyysin ja suunnitteluvaiheiden (System Analysis & Design), sekä digitaalisen palvelumuotoilun (Digital Service ...
  • Browse materials
  • Browse materials
  • Articles
  • Conferences and seminars
  • Electronic books
  • Historical maps
  • Journals
  • Tunes and musical notes
  • Photographs
  • Presentations and posters
  • Publication series
  • Research reports
  • Research data
  • Study materials
  • Theses

Browse

All of JYXCollection listBy Issue DateAuthorsSubjectsPublished inDepartmentDiscipline

My Account

Login

Statistics

View Usage Statistics
  • How to publish in JYX?
  • Self-archiving
  • Publish Your Thesis Online
  • Publishing Your Dissertation
  • Publication services

Open Science at the JYU
 
Data Protection Description

Accessibility Statement

Unless otherwise specified, publicly available JYX metadata (excluding abstracts) may be freely reused under the CC0 waiver.
Open Science Centre