Semantic annotation and big data techniques for patent information processing
Authors
Date
2017This thesis analyzes approaches to generate semantic annotations on patent records,
as well as on other structured data, by relying on the structure and semantic representation
of documents. Information in patent records reflects how real-world technologies evolve,
and the approximately 3 million annual new patent applications capture the global inventive
frontier. The volume of this information is too big to be effectively analyzed purely with
human effort, necessitating Big data approaches to analyze it with computer aided tools and
techniques. Big data is a term that describes a massive volume of structured, semi structured
and unstructured data that is so large to the point that it is difficult to process using tradi-
tional database and software tools and techniques. Currently, technical information, such as
patents, is typically stored in data repositories that do not support advanced Big data methods
to structure and interpret documents. In the emerging Semantic technology, annotation, Web
search, as well as interpretation and aggregation can be addressed by ontology-based seman-
tic annotation. This thesis examines semantic annotation and other Big data methodologies,
and their basic requirements, and reviews the current generation of semantic annotation and
other Big data systems. As a use case, this thesis demonstrates how semantic annotation
and other Big data techniques are employed to enhance the human processes whereby peo-
ple retrieve information, carry out analysis or discovery within a large collection of patent
information.
...
Semanttinen annotaatio ja big data-menetelmiä patentti-informaation prosessointiin.
Tämä tutkielma analysoi miten luoda semanttisia annotaatioita
patenttietueisiin, tai muuhun ei-strukturoituun dataa, hyödyntämällä tietueiden rakennetta
tai semanttista representaatiota. Patenttitietueet sisältävät kokonaisuutena informaation
siitä, miten reaalimaailman teknologiat kehittyvät ja muuttuvat, ja vuosittain globaalisti
julkaistavat noin 3 miljoonaa uutta patenttihakemusta kuvaavat hyvin globaalin keksintörintaman
kehitystä. Tämä informaatio on volyymiltaan liian laaja, jotta sitä voisi tehokkasti
analysoida ja käsitellä puhtaasti ihmisvoimin. Tästä syystä sen analysointiin tarvitaan erityisiä
Big data lähestymistapoja, jotka hyödyntävät tietokoneavusteisia työkaluja ja -prosesseja.
Big data on termi joka kuvaa erittäin suurta volyymia strukturoitua, osittain strukturoitua tai
strukturoimatonta dataa, joka on niin suuri että sen prosessointi perinteisin tietokanta- tai
ohjelmistoteknisin työkaluin tai tekniikoin on vaivalloista. Nykyisin tekninen informaatio,
kuten patentit, säilytetään datakokoelmissa, jotka eivät tue edistyneitä Big data menetelmiä
strukturoida ja tulkita dokumentteja. Nousevassa Semanttisessa teknologiassa annotaatio,
web-haku, sekä tulkinta ja koostaminen käsitellään ontologia-pohjaisella semanttisella annotaatiolla.
Tämä tutkielma käsittelee semanttista annotaatiota ja muita Big data menetelmiä
ja niiden perusedellytyksiä, sekä tarkastelee nykyaikaisia semanttisen annotaation ja muiden
Big data menetelmien järjestelmiä. Tapaustutkimuksena tämä tutkielma osoittaa, miten semanttista
annotaatiota ja muita Big data tekniikoita voidaan hyödyntää parantamaan prosesseja,
joiden avulla ihmiset hakevat tietoa, tekevät analyysiä tai hakuja erittäin suuresta
patentti-informaation kokoelmasta.
...




Keywords
Metadata
Show full item recordCollections
- Pro gradu -tutkielmat [24532]
Related items
Showing items with similar title or keywords.
-
Taming big knowledge evolution
Cochez, Michael (University of Jyväskylä, 2016)Information and its derived knowledge are not static. Instead, information is changing over time and our understanding of it evolves with our ability and willingness to consume the information. When compared to humans, ... -
GUI personalization framework driven by personal semantic user profile
Suopellonmäki, Pekka (2017)Sovelluskehys käyttöliittymän personointiin käyttäen semanttista käyttäjäprofiilia. Internetin kehittyessä maailma verkostoituu yhä enemmän. Käytämme päivittäin monia laitteita ja erilaisia käyttöliittymiä, mutta vaikka ... -
A Text-based Ontology-driven Decision Support System
Nguyen Kim, Chinh (2018)The coming of the Big Data era has posed great challenges to the traditional de- cision support systems, which are unable to effectively leverage unstructured data, necessi- tating more flexible and adaptable approaches. ... -
Intellectual property rights and economic growth
Lindroos, Juho (2015)Striving for greater economic growth, requires a great understanding of the underlying factors. One of the factors may be the intellectual property rights and the level of its protection. Whether it is and how does it ... -
The role of utility models in patent filing strategies : evidence from European countries
Heikkilä, Jussi; Verba, Michael (Springer, 2018)We examine the role of utility models (UM) in patent filing strategies. With an extensive patent family data from European countries, we explore the structures and characteristics of patent families, which include UMs. A ...