Title Migracija skladišta podataka u skladište u oblaku
Title (english) Migrating a data warehouse to a warehouse based on cloud architecture
Author Kruno Lapat
Mentor Mirta Baranović (mentor)
Committee member Mirta Baranović (predsjednik povjerenstva)
Committee member Vedran Mornar (član povjerenstva)
Committee member Slaven Zakošek (član povjerenstva)
Granter University of Zagreb Faculty of Electrical Engineering and Computing Zagreb
Defense date and country 2020-07-15, Croatia
Scientific / art field, discipline and subdiscipline TECHNICAL SCIENCES Computing
Abstract Tema diplomskog rada je Migracija skladišta podataka u skladište u oblaku, a podrazumijeva migraciju postojećeg skladišta podataka u Microsoft Azure oblak.
Skladište podataka je sustav koji periodično preuzima i konsolidira podatke iz izvornih sustava u dimenzionalno ili normalizirano spremište podataka. ETL je sustav koji se može povezati s izvornim sustavima, čitati podatke, transformirati podatke i učitati ih u ciljni sustav. Poslovna inteligencija predstavlja koncept kojem je cilj poboljšanje poslovanja. Sve što pripada jednom skladištu podataka jesu procesi, tehnologije i alati potrebni kako bi se iz podataka dobile informacije, iz informacija znanje, a iz znanja planovi koji će omogućiti profitabilne poslovne poteze. Poslovna inteligencija obuhvaća skladištenje podataka, analitičke poslovne alate i upravljanje sadržajem / znanjem. Podaci su u skladištu podataka pohranjeni u dimenzijskom modelu koji nije normaliziran. Postoje dvije takve vrste modela: zvjezdasti i pahuljasti. U zvjezdastom modelu dimenzije simuliraju krakove zvijezde, dok je činjenična tablica u središtu zvijezde. Dimenzijska i činjenična tablica su uvijek u odnosu 1:N. Činjenična tablica odgovara procesu koji se prati u skladištu podataka i sadrži dvije skupine numeričkih atributa, ključeve dimenzijskih tablica i mjere. Mjere su numerički atributi koji daju "ocjenu" procesa koji se prati činjeničnom tablicom. Granularnost se odnosi na razinu detalja odnosno razinu agregacije podataka (činjenica, zapisa) u skladištu podataka. Granularnost je manja što su podaci detaljnije predstavljeni, a veća što su manje detaljno predstavljeni. Dimenzijska tablica odgovara subjektu / objektu koji sudjeluje u procesu koji se prati u skladištu podataka i skladište sadrži N takvih tablica. Uloga dimenzijske tablice je da objašnjava činjenice pohranjene u činjeničnoj tablici. Računarstvo u oblaku je usluga koja omogućuje pružanje računalnih resursa, hardvera i softvera, preko mrežne infrastrukture krajnjim korisnicima. Azure SQL baza podataka usluga je na razini baze podataka koja pruža predvidljive performanse, skalabilnost bez zastoja, kontinuitet poslovanja i zaštitu podataka. U radu su korišteni SQL Server Management Studio 17 za izradu skladišta podataka I manipulaciju podacima, Visual Studio 2019 za izradu SSIS paketa te aplikacija Data Migration Assistant za pomoć kod procjene I izradu migracije.
Tijek izrade i korištenja skladišta podataka te izvršavanje migracije u oblak su prikazani i opisani u ovom diplomskom radu.
Abstract (english) The topic of the diploma thesis is the Migration of a data warehouse to a cloud storage, and it involves the migration of an existing data warehouse to Microsoft Azure cloud.
A data warehouse is a system that periodically downloads and consolidates data from source systems into a dimensional or normalized data warehouse. ETL is a system that can connect to source systems, read data, transform data, and load it into the target system. Business intelligence is a concept that aims to improve business. All that belongs to a single data warehouse are the processes, technologies, and tools needed to obtain information from data, knowledge from information, and plans from knowledge that will enable profitable business moves. Business intelligence includes data warehousing, analytical business tools, and content / knowledge management. The data in the data warehouse is stored in a dimensional model that is not normalized. There are two such types of models: star and snowflake. In the star model, the dimensions simulate the arms of the star, while the fact table is in the center of the star. The dimensional and fact tables are always in a 1: N relationship. The fact table corresponds to the process that is monitored in the data warehouse and contains two groups of numeric attributes, dimension table keys and measures. Measures are numerical attributes that give an “estimate” of the process followed by the fact table. Granularity refers to the level of detail or the level of aggregation of data (facts, records) in the data warehouse. The granularity is lower the more detailed the data presented, and higher the less detailed the data presented. The dimension table corresponds to the entity / object which is participating in the process that is monitored in the data warehouse and the warehouse contains N such tables. The role of the dimension table is to explain the facts stored in the fact table. Cloud computing is a service that enables the provision of computing resources, hardware and software, over a network infrastructure to end users. Azure SQL Database is a database-level service that provides predictable performance, downtime scalability, business continuity, and data protection. The diploma thesis used SQL Server Management Studio 17 for data warehouse creation and data manipulation, Visual Studio 2019 for SSIS package development and Data Migration Assistant application for assistance in estimating and creating migration.
The course of creating and using data warehouses and performing migration to the cloud are presented and described in this thesis.
Keywords
migracija
baza podataka
Microsoft Azure
skladište podataka
ETL proces
poslovna inteligencija
zvjezdasti model
dimenzijska tablica
činjenična tablica
mjere
računarstvo u oblaku
SQL Server Management Studio
Visual Studio
Data Migration Assistant
Keywords (english)
migration
database
Microsoft Azure
data warehouse
ETL process
business intelligence
star model
dimension table
fact table
measures
cloud computing
SQL Server Management Studio
Visual Studio
Data Migration Assistant
Language croatian
URN:NBN urn:nbn:hr:168:972956
Study programme Title: Computing Study programme type: university Study level: graduate Academic / professional title: magistar/magistra inženjer/inženjerka računarstva (magistar/magistra inženjer/inženjerka računarstva)
Type of resource Text
File origin Born digital
Access conditions Closed access
Terms of use
Public note
Created on 2023-01-13 10:17:43