Naslov Sustav za prevođenje poslovnih opisa u model podataka entiteta i veza
Naslov (engleski) System for transformation of business specifications into entity-relationship model
Autor Sabrina Šuman
Mentor Alen Jakupović (mentor)
Mentor Sanja Čandrlić (komentor)
Član povjerenstva Mile Pavlić (predsjednik povjerenstva)
Član povjerenstva Sanda Martinčić-Ipšić (član povjerenstva)
Član povjerenstva Zdravko Dovedan Han (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Rijeci (Fakultet informatike i digitalnih tehnologija) Rijeka
Datum i država obrane 2019-11-25, Hrvatska
Znanstveno / umjetničko područje, polje i grana DRUŠTVENE ZNANOSTI Informacijske i komunikacijske znanosti
Univerzalna decimalna klasifikacija (UDC ) 004 - Računalna znanost i tehnologija. Računalstvo. Obrada podataka
Sažetak Modeliranje podataka složen je proces koji zahtijeva znanje i iskustvo od dizajnera, a čija kvaliteta znatno utječe na izvedbu u narednim fazama razvoja informacijskog sustava. Karakteristike procesa modeliranja (složen, nealgoritamski, zahtijeva znanje i iskustvo dizajnera) čine ga prikladnim područjem za kreiranje sustava temeljenog na znanju (engl. Knowledge Based System – KBS). Ovim se radom prezentira KB sustav za potporu modeliranju podataka koji je baziran na verbalizaciji. Sustav će upotrebljavati znanje eksperata koje je formalizirano primjenom metoda formalnog jezika. Osnovna funkcionalnost sustava jest prevođenje poslovnog ili nekoga drugog opisa danog u kontroliranom prirodnom engleskom jeziku (engl. Controlled natural English – CEN) u model podataka izraženog u formalnom jeziku modela podataka. Za izvođenje svojih osnovnih funkcionalnosti upotrebljavat će kreiranu bazu znanja temeljenu na pravilima prevođenja primjenom metode raspoznavanja uzoraka. Cjelokupna baza znanja sastoji se od niza kreiranih artefakata (opisani teorijski i implementirani programskim kodom) koji su omogućili izgradnju osnovnog dijela sustava. Definirani artefakti jesu gramatike kontroliranog i formalnog jezika modela podataka (EARC jezik, engl. Entities Attributes Relations Cardinalities), kreiranje posebnog leksikona s nizom dodatnih EARC svojstava, sintaksna analiza kroz prepoznavač kojim se ispituje sintaksna ispravnost, niz pravila prevođenja te sustav postavljanja pitanja i dobivanja odgovora (engl. Question-Answering system – QA system) kojim će biti omogućena komunikacija s korisnikom. Na temelju pregleda relevantne literature te analize procesa modeliranja od strane eksperata definirani su osnovni elementi i funkcionalni zahtjevi KB sustava. Kroz prikaz arhitekture sustava detaljno su opisani svi njegovi dijelovi, korisnici te okolina sustava. Opisani su i priloženi osnovni algoritmi sintaksne analize i prevođenja. Prikazani su primjeri prevođenja s detaljnom analizom svakog koraka. Provedeno je testiranje prototipa sustava s analizom rezultata te su potvrđene postavljene hipoteze. Navedena su i ograničenja sustava i pravci budućeg istraživanja te je o njima diskutirano.
Sažetak (engleski) Data modelling is a complex process which requires knowledge and experience from designers, whose quality has a significant impact on performance in the upcoming stages of information system development. The characteristics of the modelling process (complex, non-algorithmic, requiring knowledge and experience of designers) make it a suitable knowledge-based knowledge base (Knowledge-Based System – KBS). This dissertation presents a system based on data modelling support on verbalization. The system will use expert knowledge which is formalized using formal language methods, in verbalized form. The basic functionality of the system is to translate a business or other description given in Controlled Natural English (CEN) into a model of data expressed in the formal language of the data model. To perform its basic functionality, it will use a created knowledge-based approach using the form-recognition method. The entire knowledge base consists of a series of created artefacts (described in theoretical and implemented code) which have enabled the construction of the basic part of the system. The defined artefacts are the grammar of the controlled and formal language data model (EARC language, Entities Attributes Relations Cardinalities), the creation of a special lexicon with a series of additional EARC properties, syntactic analysis through a recognizer which examines syntax correctness, a set of translation rules, and the Question-Answering system(QA) which will enable communication with the user. Based on a review of the relevant literature and the analysis of the modelling process by the experts, the basic elements and functional requirements of the KB system were defined. Throughout the architecture of the system, all its parts, users and system environment are described in detail. Basic syntax analysis and translation algorithms are described and enclosed. Translation examples are shown with a detailed analysis of each step. Testing of a system prototype was carried out and the hypotheses were confirmed. Limitations of the system and directions for future research as well are enclosed and discussed.
Ključne riječi
poslovni opis
strojno prevođenje
verbalizacija
sustav temeljen na znanju
formalni jezici
raspoznavanja uzoraka
konceptualno modeliranje
metoda entiteta i veza
Ključne riječi (engleski)
business description
machine translation
verbalisation
knowledge-based systems
formal languages
pattern recognition
conceptual modelling
entity-relationship method
Jezik hrvatski
URN:NBN urn:nbn:hr:195:652886
Datum promocije 2021
Studijski program Naziv: Informatika Vrsta studija: sveučilišni Stupanj studija: poslijediplomski doktorski Akademski / stručni naziv: doktor znanosti iz znanstvenog područja Društvene znanosti, polja Informacijske i komunikacijske znanosti. (dr.sc.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Pristup korisnicima matične ustanove
Uvjeti korištenja
Datum i vrijeme pohrane 2021-04-26 08:22:35