Show simple item record

dc.contributor.advisorCochez, Michael
dc.contributor.advisorTerziyan, Vagan
dc.contributor.authorMwakyusa, Phesto Enock
dc.date.accessioned2017-10-23T13:27:04Z
dc.date.available2017-10-23T13:27:04Z
dc.date.issued2017
dc.identifier.otheroai:jykdok.linneanet.fi:1726691
dc.identifier.urihttps://jyx.jyu.fi/handle/123456789/55667
dc.description.abstractThis thesis analyzes approaches to generate semantic annotations on patent records, as well as on other structured data, by relying on the structure and semantic representation of documents. Information in patent records reflects how real-world technologies evolve, and the approximately 3 million annual new patent applications capture the global inventive frontier. The volume of this information is too big to be effectively analyzed purely with human effort, necessitating Big data approaches to analyze it with computer aided tools and techniques. Big data is a term that describes a massive volume of structured, semi structured and unstructured data that is so large to the point that it is difficult to process using tradi- tional database and software tools and techniques. Currently, technical information, such as patents, is typically stored in data repositories that do not support advanced Big data methods to structure and interpret documents. In the emerging Semantic technology, annotation, Web search, as well as interpretation and aggregation can be addressed by ontology-based seman- tic annotation. This thesis examines semantic annotation and other Big data methodologies, and their basic requirements, and reviews the current generation of semantic annotation and other Big data systems. As a use case, this thesis demonstrates how semantic annotation and other Big data techniques are employed to enhance the human processes whereby peo- ple retrieve information, carry out analysis or discovery within a large collection of patent information.en
dc.description.abstractSemanttinen annotaatio ja big data-menetelmiä patentti-informaation prosessointiin. Tämä tutkielma analysoi miten luoda semanttisia annotaatioita patenttietueisiin, tai muuhun ei-strukturoituun dataa, hyödyntämällä tietueiden rakennetta tai semanttista representaatiota. Patenttitietueet sisältävät kokonaisuutena informaation siitä, miten reaalimaailman teknologiat kehittyvät ja muuttuvat, ja vuosittain globaalisti julkaistavat noin 3 miljoonaa uutta patenttihakemusta kuvaavat hyvin globaalin keksintörintaman kehitystä. Tämä informaatio on volyymiltaan liian laaja, jotta sitä voisi tehokkasti analysoida ja käsitellä puhtaasti ihmisvoimin. Tästä syystä sen analysointiin tarvitaan erityisiä Big data lähestymistapoja, jotka hyödyntävät tietokoneavusteisia työkaluja ja -prosesseja. Big data on termi joka kuvaa erittäin suurta volyymia strukturoitua, osittain strukturoitua tai strukturoimatonta dataa, joka on niin suuri että sen prosessointi perinteisin tietokanta- tai ohjelmistoteknisin työkaluin tai tekniikoin on vaivalloista. Nykyisin tekninen informaatio, kuten patentit, säilytetään datakokoelmissa, jotka eivät tue edistyneitä Big data menetelmiä strukturoida ja tulkita dokumentteja. Nousevassa Semanttisessa teknologiassa annotaatio, web-haku, sekä tulkinta ja koostaminen käsitellään ontologia-pohjaisella semanttisella annotaatiolla. Tämä tutkielma käsittelee semanttista annotaatiota ja muita Big data menetelmiä ja niiden perusedellytyksiä, sekä tarkastelee nykyaikaisia semanttisen annotaation ja muiden Big data menetelmien järjestelmiä. Tapaustutkimuksena tämä tutkielma osoittaa, miten semanttista annotaatiota ja muita Big data tekniikoita voidaan hyödyntää parantamaan prosesseja, joiden avulla ihmiset hakevat tietoa, tekevät analyysiä tai hakuja erittäin suuresta patentti-informaation kokoelmasta.fi
dc.format.extent1 verkkoaineisto (73 sivua)
dc.format.mimetypeapplication/pdf
dc.language.isoeng
dc.rightsJulkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.fi
dc.rightsThis publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.en
dc.subject.othersemanttinen annotointi
dc.subject.otherData Mining
dc.subject.otherSemantic annotation
dc.subject.otherPatent information
dc.titleSemantic annotation and big data techniques for patent information processing
dc.identifier.urnURN:NBN:fi:jyu-201710234047
dc.type.ontasotPro gradu -tutkielmafi
dc.type.ontasotMaster’s thesisen
dc.contributor.tiedekuntaInformaatioteknologian tiedekuntafi
dc.contributor.tiedekuntaFaculty of Information Technologyen
dc.contributor.laitosInformation Technologyen
dc.contributor.laitosTietotekniikan laitosfi
dc.contributor.yliopistoUniversity of Jyväskyläen
dc.contributor.yliopistoJyväskylän yliopistofi
dc.contributor.oppiaineTietotekniikkafi
dc.contributor.oppiaineMathematical Information Technologyen
dc.date.updated2017-10-23T13:27:04Z
dc.rights.accesslevelopenAccessfi
dc.type.publicationmasterThesis
dc.contributor.oppiainekoodi602
dc.subject.ysobig data
dc.subject.ysotiedonlouhinta
dc.subject.ysopatentit
dc.subject.ysoannotointi
dc.format.contentfulltext
dc.type.okmG2


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record