Naslov Model strojnog učenja za predviđanje trendova na financijskim tržištima
Naslov (engleski) Machine Learning Model for Trend Prediction in Financial Markets
Autor Bruno Skendrović
Mentor Zvonko Kostanjčar (mentor)
Član povjerenstva Zvonko Kostanjčar (predsjednik povjerenstva)
Član povjerenstva Tomislav Kovačević (član povjerenstva)
Član povjerenstva Fredi Šarić (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Zagrebu Fakultet elektrotehnike i računarstva Zagreb
Datum i država obrane 2020-09-11, Hrvatska
Znanstveno / umjetničko područje, polje i grana TEHNIČKE ZNANOSTI Računarstvo
Sažetak Zbog težine procjene kretanja cijena dionica koristimo razne metode i tehnike interpretiranja trenda na financijskom tržištu. Jedan od takvih metoda su modeli strojnog učenja.
U prvom poglavlju analiziramo algoritme više od 15 različitih filtra s pomičnim presjekom. Filtre koristimo za odstranjivanje šume i zaglađivanje vremenskog niza podataka. Zaglađenost filtra ovisi o duljini vremenskog perioda (prozora) u kojem računa prosjek stoga odabiremo onakvu duljinu prozora koja daje što bolji omjer preciznosti i zaglađenosti filtra. Filtre spremamo u filtarsku banku koju kasnije koristimo kao ulazne primjere našeg modela.
U drugom poglavlju diskutiramo o korisnosti i svojstvima l1 trend filtra (l1tf). L1tf je zbog svojstva linearnosti po dijelovima dobar pokazatelj mijenjanja trenda. Koliko će l1tf pratiti cijene dionica ovisi o parametru lambda koji regulira broj promjena nagiba l1 filtra. Isprobavanjem različitih vrijednosti na velikom skupu dionica, odabiremo vrijednost lambde koja daje najviše pogođenih trendova u budućnosti. Naposljetku, l1tf će se koristiti kao vektor oznaka za model strojnog učenja.
Treće poglavlje prolazi kroz osnove regresijksih analiza te kada koristimo linearnu regresiju na uređeni par zavisne i nezavisne varijable. Model linearne regresije stvaramo i treniramo pomoću python biblioteke skicit-learn. Korištenjem t-testa na svakog od filtra, odbacujemo one filtre koji nemaju utjecaja na ponašanje regresijskog modela.
Logistička regresija je obrađena u četvrtom poglavlju. Ovdje je vektor oznaka pretvoren u niz nula i jedinica gdje jedinice predstavljaju pozitivan, a nule negativan nagib svakog od dijela l1 filtra. Uspješnost regresijskog modela ocjenjujem metrikama poput matrice zabune, preciznost i f1 rezultata.
Povećavanjem broja filtra i poboljšavanjem njihovih algoritama te podešavanjem parametra lambde i veličine prozora. dolazimo do sve boljih rezultata i procjena. Kada smo zadovoljni s preciznošću našeg modela, zaključujemo rad gotovim.
Sažetak (engleski) Beacuse the trend estimating is so complex, we use different methods and techniques of interpreting trend on stock market. One of those methods is machine learining model.
In the first chapter we analyse more than 15 different moving average filters. Moving average filters are used to remove noise in time series data. The smoothness of the filter is defined by legnth of the period (window) it uses to calculate the averages. Therefore we choose window size that gives us the best accuracy and smoothness ratio. All filters are stored in bank that is later used as data instances of our model.
In the second chapter we discuss the usufulness and properties of l1 trend filter (l1tf). L1tf is a good trend indicator due to its picewise linearity. How much will the l1tf follow the original data depends on the regularization parameter lambda which defines the number of slopes that l1 fitler has. By using large number of data on various values of lambda, we choose lambda that had the most correct future trend estimtes, L1tf will be used as labels of our machine learning model.
The third chapter goes through the basics of regression analysis and when do we use linear regression on arranged pairs of dependent and independent variables. We create and train our linear regression model with the help of python library skicit-learn. By using the t-test on every of the filters, we reject those filters who are irrelevant to our regression model.
Logistic regression is the subject of chapter four. For this regression we redefine our labels to series of ones and zeros, where ones represent the positive, and zeros the negative slope of each piece of the l1 filter. We use different metrics to represent the success of our model, such as confusion matrix, accuracy and f1 score.
By adding more moving average filters and improving ther algorithm, and also by adjusting the values of parameter lambda and window size, we improve the results and estimates of our model. When we are satisfied with the accuary of our logistic regression model, we conclude the task finished.
Ključne riječi
strojno učenje
procjena trenda
filtri s pomičnim prosjekom
filtarska banka
vektor značajki
l1 trend filtar
oznake
parametar lambda
model strojnog učenja
regresijska analiza
linearna regresija
višestruka linearna regresija
unakrsna provjera
prenaučenost
t-test
logistička regresija
metrike uspješnosti modela
Ključne riječi (engleski)
machine learning
estimating trends
moving average filters
filter bank
vector of features
l1 trend filter
parameter lambda
machine learning model
regression analysis
linear regression
multiple linear regression
cross-validation
overfitting
t-test
logistic regression
metrics and scoring of regression models
Jezik hrvatski
URN:NBN urn:nbn:hr:168:164791
Studijski program Naziv: Računarstvo Vrsta studija: sveučilišni Stupanj studija: preddiplomski Akademski / stručni naziv: sveučilišni/a prvostupnik/ prvostupnica (baccalaureus/baccalaurea) inženjer/inženjerka računarstva (univ.bacc.ing.comp.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Zatvoreni pristup
Uvjeti korištenja
Javna napomena
Datum i vrijeme pohrane 2023-01-13 16:05:26