Title Standardizacija i unifikacija upisivanja i upravljanja sadržajem u aplikacijama upravljanja znanjem
Title (english) Standardization and unification of content generation and management in knowledge base applications
Author Ivana Barić
Mentor Sanda Martinčić-Ipšić (mentor)
Committee member Marina Ivašić-Kos (predsjednik povjerenstva)
Committee member Sanda Martinčić-Ipšić (član povjerenstva)
Committee member Ana Meštrović (član povjerenstva)
Granter University of Rijeka (Faculty of Informatics and Digital Technologies) Rijeka
Defense date and country 2019-07-12, Croatia
Scientific / art field, discipline and subdiscipline SOCIAL SCIENCES Information and Communication Sciences
Abstract U diplomskom radu opisan je postupak standardizacije i unifikacije upisivanja i upravljanja sadržajem u aplikacijama upravljanja znanjem. Tema obuhvaća postupke računalne analize prirodnog jezika koji korisniku pomažu prilikom upisa novog znanja zasnovanog na već postojećem znanju. Također su obrađeni postupci ujedinjavanja novog znanja kroz procese preobrazbe, mapiranja, dedupliciranja te izvoza radi jednostavnije pretrage i analize zapisanih znanja odnosno podataka. U uvodu se opisuje područje primjene računalne analize prirodnog jezika, strojnog učenja te različiti postupci i tehnike koji se upotrebljavaju. U opisu problema dan je kratak osvrt konkretnog problema koji će se rješavati koristeći navedene postupke i odgovarajuće programske alate. Opisani su postupci ekstrakcije informacija iz podataka uz pomoć odgovarajućih alata i metoda računalne analize prirodnog jezika poput Python-a kao i metoda koje se koriste u sustavu za podršku odlučivanju te strojnom učenju zajedno s upotrijebljenim alatima MicroStrategy, Gephi i Weka. Na osnovu dobivenih informacija, predstavljena su moguća rješenja za realizaciju problema kojim se bavi ovaj diplomski rad. Podaci koji su se koristili u ovom diplomskom radu preuzeti su iz baze znanja stvarne poslovne organizacije, te su zbog svoje povjerljivosti i činjenice da je njihov sadržaj poslovna tajna modificirani i na taj način zaštićeni. U prvoj fazi predstavljen je dio rješenja koji se bavi analizom i nadziranjem kvalitete podataka te klasifikacijom osnovnih elemenata u odgovarajuće klase, omogućavajući tako standardizaciju samog unosa podataka u bazu kao i osiguravanje njihove kvalitete. U drugoj fazi opisan je postupak postavljanja standarda za osiguravanje kvalitete podataka prilikom njihovog unosa putem aplikacije. U trećoj i posljednjoj fazi, korištenjem metoda za ekstrakciju ključnih riječi, vizualno su predstavljeni najčešće korišteni osnovni elementi u opisivanju određenog uređaja.
Abstract (english) In this master thesis, the process of standardization and unification of content generation and management in knowledge base applications is described. The theme includes methods of computer language processing that helps the user to admit new knowledge that's based on already familiar knowledge. The processes of unification of new knowledge were also studied through transformation, mapping, deduplication and export for easier search and analysis of written knowledge or data. The introduction describes the domain in which the computer (natural) language processing, machine learning, various procedures, and techniques are used. In the description of the problem, there is a brief overview of the specific problem that will be solved using the mentioned procedures and the corresponding software tools. Procedures for extracting information from data are described with the help of the appropriate tools and methods of computer language processing such as Python as well as the methods used in the decision support systems and machine learning. Also, tools like MicroStrategy, Gephi and Weka that were used in visualizing the results are described. Based on the information obtained, possible solutions to the problem of this master thesis are presented. The data used in this master thesis is taken from the knowledge base of a real business organization, but because of their confidentiality and the fact that their content is a strict business secret, the data itself has been modified accordingly. In the first phase, a part of the solution that focuses on analysis and monitoring of data quality and the classification of the basic elements to their corresponding classes is presented. The second phase focuses on establishing data quality standards for entering data through the application. The third phase is the last part of the solution and it uses keyword extraction methods to visually present the most commonly used elements in describing a specific device.
Keywords
standardizacija
unifikacija
upravljanje znanjem
baza znanja
ekstrakcija informacija
podaci
računalna analiza prirodnog jezika
ekstrakcija ključnih riječi
strojno učenje
Gephi
Weka
MicroStrategy
NetworkX
graf
stabla odlučivanja
slučajna šuma
Keywords (english)
standardization
unification
knowledge management
knowledge base
the extraction of information
data
computer language processing
NLP
keyword extraction
machine learning
Gephi
Weka
MicroStrategy
NetworkX
graph
decision trees
random forest
Language croatian
URN:NBN urn:nbn:hr:195:231260
Study programme Title: Informatics Study programme type: university Study level: graduate Academic / professional title: magistar/magistra informatike (magistar/magistra informatike)
Type of resource Text
File origin Born digital
Access conditions Access restricted to students and staff of home institution
Terms of use
Created on 2019-07-08 08:47:10