Title Web aplikacija za vizualizaciju hijerarhijskih podataka
Author Mario Bošnjak
Mentor Ivica Nakić (mentor)
Committee member Ivica Nakić (predsjednik povjerenstva)
Committee member Rudi Mrazović (član povjerenstva)
Committee member Marko Erceg (član povjerenstva)
Committee member Zlatko Drmač (član povjerenstva)
Granter University of Zagreb Faculty of Science (Department of Mathematics) Zagreb
Defense date and country 2019-09-25, Croatia
Scientific / art field, discipline and subdiscipline NATURAL SCIENCES Mathematics
Abstract Web aplikacija za vizualizaciju hijerarhijskih podataka je razvijana kako bi se olakšalo vizualizaciju podataka u kojima postoji relacija ili hijerarhija. Mogućnost različitih prostornih raspoređivanja čvorova daje dodatni uvid podatke. Tako Breadthfirstsearch layout omogućava pregled hijerarhije unutar usmjerenog grafa, te jednostavnu izolaciju jednog ili više korijena, ako postoje unutar grafa. Izolacijom predaka pojedinog čvora možemo dobiti sve izravne prethodnike nekog čvora te tako izolirati podgraf koji sadrži samo one čvorove i bridove koji su bitni u kontekstu odabranog čvora. Filtriranje po kategorijama čvorova pruža uvid u to kakve veze postoje unutar nekog podskupa podataka s danim obilježjem, to jest kategorijom. Postoji veliki skup raznovrsnih podataka koji se mogu prilagoditi i prikazati pomoću ovakve aplikacije, a to može biti kao što je prikazano u primjeru, skup znanja iz nekog udžbenika. Dodatno se mogu prikazati skupovi podataka poput prometne, telekomunikacijske, plinske, vodovodne ili električne mreže. Osim toga može se koristiti u razvoju softvarea za prikaz Entity-Relationship\(^1\) modela ili kao dijagram da se vide međuovisnosti pojedinih biblioteka ili paketa koji su potrebni za razvoj aplikacije. Tu svakako spada i mogućnost kreiranja grafa povezanosti između web stranica pa bi to bilo izrazito zanimljivo napraviti za Wikipediu, koja ima mnoštvo poveznica između stranica koje bi predstavljale čvorove. Aplikacija se može koristiti i za kreiranje skupa podataka tako da se korištenjem sučelja kreiraju novi projekti, grafovi, informacije i veze među njima koje se potom automatski spremaju u strukturu koja se može vizualizirati, a isto tako i uređivati i nadograđivati. Prostor za širenje funkcionalnosti aplikacije postoji na svim razinama. Od optimizacije koda, do dodavanja novih funkcionalnosti koje se mogu koristiti za bolju vizualizaciju skupa podataka. Prostor leži i u povezivanju aplikacije s metodama strojnog učenja koje otvaraju jednu novu dimenziju. Primjer bi bio određeni skup pojmova, te klasični tekst bez ikakvih posebnih tagova. Tada bi se korištenjem tehnika vezanih za NLP\(^2\) mogla napraviti obrada teksta te vizualizirati povezanost danih pojmova unutar teksta. Izazovi za ovakvu aplikaciju su prvenstveno u veličini podataka i njihovoj pripremi. Ostaju otvorena pitanja kako bi se aplikacija ponašala u slučaju vizualizacije grafova koji sadrže milijune čvorova te još više bridova. Skup podataka nad kojim bi se mogla provesti takva testiranja i proučavanja je Wikipedia, koja je javno dostupna za preuzimanje u obliku komprimirane xml datoteke. 1: https://en.wikipedia.org/wiki/Entity-relationship_model 2: https://en.wikipedia.org/wiki/Natural_language_processing
Abstract (english) Web application for visualization of hierarchically structured data was developed in order to enable visualization of any data that is structured in relational or hierarchical order. By using different graph layouts user can get an extra insight in the data. Breadthfirstsearch layout enables one to see if there is a hierarchy inside the directed graph and to isolate all root nodes inside it, if there is any. By isolating ancestors of one node, application can show all direct predecessors and by doing so user can see the subgraph that contains only the nodes and edges important for the chosen node. Filtering data by categories will enable user to see if there are any connections inside a specific subset of data. There is a vast array of different data sets that can be adapted and visualized by using an application such as this, and it can be done in the same way as it was shown in example by adapting the knowledge set from schoolbook. But it can also visualize data from traffic, telco, gas, electrical or water grid, or in software development for visualization of Entity-Relationship model, or as a diagram for modules dependency in software. There is also a potential for visualization of web, showing web pages and links between them and it would be extremely interesting to test on Wikipedia, as it has millions of articles and many more millions of links. Application can also be used for creation of data through user interface by creating projects, graphs, nodes, edges and categories that will be automatically saved in relational or hierarchical structure that can be visualized, updated or upgraded. There are many other functionalities that could be implemented in different parts of application and it is spread from optimizing code to adding new options for visualization. Other direction for improvement is connecting the application with machine learning solutions. For example, one could use a given set of data without any connections, and then create connections by extracting them with NLP from text. This would enable user to create edges between existing nodes, and by doing so build a new graph structure. There are also many challenges for application such as this one and they are primarily in size od data set and in preparation of that data set for use in application. There are still some open questions, some of them are directly related to visualization of data sets with millions of nodes and edges. Those questions could be answered by processing Wikipedia, which can be downloaded and processed.
Keywords
web aplikacija
vizualizacija hijerarhijskih podataka
Keywords (english)
web application
visualization of hierarchically structured data
Language croatian
URN:NBN urn:nbn:hr:217:483880
Study programme Title: Computer Science and Mathematics Study programme type: university Study level: graduate Academic / professional title: magistar/magistra računarstva i matematike (magistar/magistra računarstva i matematike)
Type of resource Text
File origin Born digital
Access conditions Open access
Terms of use
Created on 2020-01-13 12:19:49