Naslov Podržano učenje i Q-učenje
Naslov (engleski) Reinforcement Learning and Q-Learning
Autor Lucija Blažević
Mentor Domagoj Matijević (mentor)
Član povjerenstva Kristian Sabo (predsjednik povjerenstva)
Član povjerenstva Domagoj Matijević (član povjerenstva)
Član povjerenstva Slobodan Jelić (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište Josipa Jurja Strossmayera u Osijeku Odjel za matematiku Osijek
Datum i država obrane 2020-03-17, Hrvatska
Znanstveno / umjetničko područje, polje i grana PRIRODNE ZNANOSTI Matematika Matematička logika i računarstvo
Sažetak Ovaj diplomski rad proučava podskupinu strojnog učenja koja se naziva
podržano učenje. U radu pokrivamo osnove podržanog učenja i proučavamo jedan
algoritam podržanog učenja, Q-učenje, te uz pomoć Python programskog jezika, na
praktičnom primjeru, primjenjujemo taj algoritam.
Prvo poglavlje ovoga rada sadrži uvod u kojem čitatelju dajemo do znanja kako se,
u današnje vrijeme, umjetna inteligencija i strojno učenje sve više i više razvijaju
i primjenjuju u svakodnevnom životu. Uvodimo neke osnovne probleme kojima se
strojno učenje bavi kako bi na samome početku dobili osnovnu percepciju o ovom
području računalne znanosti.
U drugom poglavlju ovoga rada upoznajemo se s osnovnim konceptima strojnog
učenja te trima vrstama strojnog učenja: nadzirano, nenadzirano i podržano učenje.
Treće poglavlje namjenjeno je isključivo proučavanju podržanog učenja. U tom poglavlju možemo vidjeti gdje se sve primjenjuje podržano učenje te počemu se ono
razlikuje od ostalih vrsta strojnog učenja. Nakon toga, proučavamo osnovne karakteristike podržanog učenja te osnovne komponente. Upoznajemo se sa scenarijem
podržanog učenja i proučavamo tko je agent, što je okolina te što su stanja, akcije i
nagrade.
Nakon što smo smo se upoznali s osnovama podržanog učenja, u četvrtom poglavlju
možemo vidjeti na koji način dijelimo algoritme podržanog učenja.
Peto poglavlje posvećeno je Markovljevom procesu odlučivanja gdje možemo vidjeti
kako matematički formulirati problem podržanog učenja.
Na samome kraju, u šestom poglavlju, proučavamo jedan algoritam podržanog učenja
koji se naziva Q-učenje te na jednom jednostavnom primjeru gledamo kako primjeniti
taj algoritam u praksi.
Sažetak (engleski) This paper examines a subset of machine learning called reinforcement
learning. In this paper we cover the basics of reinforcement learning and study one
of reinforcement learning algorithms, Q-learning, and with the help of Python programming language, we apply this algorithm on a practical example.
The first chapter of this paper contains an introduction in which we inform the reader
how, nowadays, artificial intelligence and machine learning are increasingly being developed and applied in everyday life. We introduce some basic problems that machine
learning deals with in order to get a basic perception of this area of computer science.
In the second chapter of this paper we are introduced to the basic concepts of machine learning and the three types of machine learning: supervised, unsupervised and
reinforcement learning.
The third chapter is intended exclusively for the study of reinforcement learning. In
this chapter we can see where all the reinforcement learning is applied and how it differs from other types of machine learning. After that, we study the characteristics of
reinforcement learning and basic components. We learn about typical reinforcement
learning scenario and study who the agent is, what the environment is, and what the
states, actions and rewards are.
After learning basics of reinforcement learning, in Chapter 4, we study about reinforcement learning algorithms.
The fifth chapter is devoted to Markov Decision Process, where we can see how to
mathematically formulate the problem of reinforcement learning.
Finally, in Chapter Six, we study a certain reinforcement learning algorithm called
Q-learning, and in one simple example, we can see how to implement that algorithm.
Ključne riječi
strojno učenje
podržano učenje
agent
okolina
stanje
akcija
nagrada
Markovljev proces odlučivanja
Q-učenje.
Ključne riječi (engleski)
machine learning
reinforcement learning
agent
environment
state
action
reward
Markov Decision Process
Q-Learning
Jezik hrvatski
URN:NBN urn:nbn:hr:126:960329
Studijski program Naziv: Matematika; smjerovi: Financijska matematika i statistika, Matematika i računarstvo, Industrijska i primijenjena matematika Smjer: Financijska matematika i statistika Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra matematike (mag.math.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Otvoreni pristup
Uvjeti korištenja
Datum i vrijeme pohrane 2020-03-27 06:57:15