Naslov Migracija skladišta podataka u skladište u oblaku
Naslov (engleski) Migrating a data warehouse to a warehouse based on cloud architecture
Autor Kruno Lapat
Mentor Mirta Baranović (mentor)
Član povjerenstva Mirta Baranović (predsjednik povjerenstva)
Član povjerenstva Vedran Mornar (član povjerenstva)
Član povjerenstva Slaven Zakošek (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Zagrebu Fakultet elektrotehnike i računarstva Zagreb
Datum i država obrane 2020-07-15, Hrvatska
Znanstveno / umjetničko područje, polje i grana TEHNIČKE ZNANOSTI Računarstvo
Sažetak Tema diplomskog rada je Migracija skladišta podataka u skladište u oblaku, a podrazumijeva migraciju postojećeg skladišta podataka u Microsoft Azure oblak.
Skladište podataka je sustav koji periodično preuzima i konsolidira podatke iz izvornih sustava u dimenzionalno ili normalizirano spremište podataka. ETL je sustav koji se može povezati s izvornim sustavima, čitati podatke, transformirati podatke i učitati ih u ciljni sustav. Poslovna inteligencija predstavlja koncept kojem je cilj poboljšanje poslovanja. Sve što pripada jednom skladištu podataka jesu procesi, tehnologije i alati potrebni kako bi se iz podataka dobile informacije, iz informacija znanje, a iz znanja planovi koji će omogućiti profitabilne poslovne poteze. Poslovna inteligencija obuhvaća skladištenje podataka, analitičke poslovne alate i upravljanje sadržajem / znanjem. Podaci su u skladištu podataka pohranjeni u dimenzijskom modelu koji nije normaliziran. Postoje dvije takve vrste modela: zvjezdasti i pahuljasti. U zvjezdastom modelu dimenzije simuliraju krakove zvijezde, dok je činjenična tablica u središtu zvijezde. Dimenzijska i činjenična tablica su uvijek u odnosu 1:N. Činjenična tablica odgovara procesu koji se prati u skladištu podataka i sadrži dvije skupine numeričkih atributa, ključeve dimenzijskih tablica i mjere. Mjere su numerički atributi koji daju "ocjenu" procesa koji se prati činjeničnom tablicom. Granularnost se odnosi na razinu detalja odnosno razinu agregacije podataka (činjenica, zapisa) u skladištu podataka. Granularnost je manja što su podaci detaljnije predstavljeni, a veća što su manje detaljno predstavljeni. Dimenzijska tablica odgovara subjektu / objektu koji sudjeluje u procesu koji se prati u skladištu podataka i skladište sadrži N takvih tablica. Uloga dimenzijske tablice je da objašnjava činjenice pohranjene u činjeničnoj tablici. Računarstvo u oblaku je usluga koja omogućuje pružanje računalnih resursa, hardvera i softvera, preko mrežne infrastrukture krajnjim korisnicima. Azure SQL baza podataka usluga je na razini baze podataka koja pruža predvidljive performanse, skalabilnost bez zastoja, kontinuitet poslovanja i zaštitu podataka. U radu su korišteni SQL Server Management Studio 17 za izradu skladišta podataka I manipulaciju podacima, Visual Studio 2019 za izradu SSIS paketa te aplikacija Data Migration Assistant za pomoć kod procjene I izradu migracije.
Tijek izrade i korištenja skladišta podataka te izvršavanje migracije u oblak su prikazani i opisani u ovom diplomskom radu.
Sažetak (engleski) The topic of the diploma thesis is the Migration of a data warehouse to a cloud storage, and it involves the migration of an existing data warehouse to Microsoft Azure cloud.
A data warehouse is a system that periodically downloads and consolidates data from source systems into a dimensional or normalized data warehouse. ETL is a system that can connect to source systems, read data, transform data, and load it into the target system. Business intelligence is a concept that aims to improve business. All that belongs to a single data warehouse are the processes, technologies, and tools needed to obtain information from data, knowledge from information, and plans from knowledge that will enable profitable business moves. Business intelligence includes data warehousing, analytical business tools, and content / knowledge management. The data in the data warehouse is stored in a dimensional model that is not normalized. There are two such types of models: star and snowflake. In the star model, the dimensions simulate the arms of the star, while the fact table is in the center of the star. The dimensional and fact tables are always in a 1: N relationship. The fact table corresponds to the process that is monitored in the data warehouse and contains two groups of numeric attributes, dimension table keys and measures. Measures are numerical attributes that give an “estimate” of the process followed by the fact table. Granularity refers to the level of detail or the level of aggregation of data (facts, records) in the data warehouse. The granularity is lower the more detailed the data presented, and higher the less detailed the data presented. The dimension table corresponds to the entity / object which is participating in the process that is monitored in the data warehouse and the warehouse contains N such tables. The role of the dimension table is to explain the facts stored in the fact table. Cloud computing is a service that enables the provision of computing resources, hardware and software, over a network infrastructure to end users. Azure SQL Database is a database-level service that provides predictable performance, downtime scalability, business continuity, and data protection. The diploma thesis used SQL Server Management Studio 17 for data warehouse creation and data manipulation, Visual Studio 2019 for SSIS package development and Data Migration Assistant application for assistance in estimating and creating migration.
The course of creating and using data warehouses and performing migration to the cloud are presented and described in this thesis.
Ključne riječi
migracija
baza podataka
Microsoft Azure
skladište podataka
ETL proces
poslovna inteligencija
zvjezdasti model
dimenzijska tablica
činjenična tablica
mjere
računarstvo u oblaku
SQL Server Management Studio
Visual Studio
Data Migration Assistant
Ključne riječi (engleski)
migration
database
Microsoft Azure
data warehouse
ETL process
business intelligence
star model
dimension table
fact table
measures
cloud computing
SQL Server Management Studio
Visual Studio
Data Migration Assistant
Jezik hrvatski
URN:NBN urn:nbn:hr:168:972956
Studijski program Naziv: Računarstvo Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra inženjer/inženjerka računarstva (mag.ing.comp.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Zatvoreni pristup
Uvjeti korištenja
Javna napomena
Datum i vrijeme pohrane 2023-01-13 10:17:43