Naslov SUSTAVI ZA SINTEZU GOVORA
Autor Matej Raguzin
Mentor Miroslav Vrankić (mentor)
Član povjerenstva Kristijan Lenac (predsjednik povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Rijeci Tehnički fakultet Rijeka
Datum i država obrane 2016-11, Hrvatska
Znanstveno / umjetničko područje, polje i grana TEHNIČKE ZNANOSTI Računarstvo
Sažetak U prvom poglavlju napravljen je uvod u diplomski rad. Definiran je pojam jezika te su opisane su razine analize govora : akustična, fonetska, fonološka, morfološka, sintaktička, semantička i pragmatička. Također, opisane su dvije najpoznatije tehnologije za sintezu govora : formantska sinteza i sinteza govora ulančavanjem jedinica.Drugo poglavlje opisuje eSpeak kao sustav za sintezu govora. Ovo poglavlje kroz osam potpoglavlja detaljno opisuje datoteke, atribute, pravila i ostale elemente koji moraju biti definirani kod kreiranja nove ili unaprijeđivanja već postojeće sinteze govora nekog jezika. Prvo potpoglavlje daje općenite informacije o softveru. Drugo potpoglavlje sadrži popis svih podržanih jezika u sustavu. U trećem potpoglavlju je definiran način na koji se stvaraju nove glasovne datoteke u sustavu te su opisani atributi koji se mogu dodijeliti glasu u eSpeaku. Četvrto potpoglavlje je rezervirano za objašnjenje kako se u softveru definira intonacija u nekom jeziku. Kroz predstavljanje _rules i _list datoteke u petom poglavlju, opisan je način pretvorba teksta u foneme. Šesto i sedmo potpoglavlje bave se definicijom fonema i tablica fonema u sustavu te njihovim atributima. Zadnje potpoglavlje drugog potpoglavlja sadrži informacije o korištenju MBROLA glasova u eSpeak sustavu. Treće poglavlje opisuje eSpeakedit, dodatni softver koji je usko vezan uz eSpeak, a namijenjen je korisnicima koji unaprijeđuju sintezu govora za neki jezik. Kroz niz opisa i slika iz sustava opisane su sve funkcionalnosti, elementi grafičkog korisničkog sučelja te način korištenja već spomenutog sustava. U četvrtom poglavlju je predstavljen praktični dio ovog diplomskog rada. Kroz modifikaciju _rules i _list datoteka za hrvatski jezik, unaprijeđen je izgovor teksta na hrvatskom jeziku.
Sažetak (engleski) The first chapter is an introduction made in the thesis. The notion of language is defined and it describes the level of speech analysis: acoustic, phonetic, phonological, morphological, syntactic, semantic and pragmatic. Also, it describes the most common technology for speech synthesis: formants synthesis and concatenation synthesis.The second chapter describes eSpeak, as the system for speech synthesis. This section through eight subchapters describes files, attributes, rules and other elements that must be defined when creating a new or improving an existing speech synthesis of a language. The first subchapter provides general information about the software. The second subchapter contains a list of all supported languages in the system. In the third subchapter, defines the way you create new voice files in the system and describes the attributes that can be assigned in eSpeak voice. The fourth subchapter contains an explanation of how the software defines the intonation in a language. Through the presentation of _rules and _list files, the fifth chapter describes how eSpeak converts text to phonemes. The sixth and seventh subchapter are dealing with the definition of phonemes and tables of phonemes in the system and their attributes. The last subchapter of the second subchapter provides information on using MBROLA voices in the eSpeak system.The third chapter describes eSpeakedit, an additional software that is closely related to the eSpeak, and is designed for users that improve speech synthesis for some language. Through a series of descriptions and graphics from the system, it is describing all the functionality, elements of graphical user interface and how to use the aforementioned system.
The fourth chapter presents the practical part of this thesis. Through modification of the _rules and _list files for the Croatian language, the pronunciation of the text in Croatian has been upgraded.
Ključne riječi
sinteza govora
formantska sinteza govora
eSpeak
eSpeakedit
Ključne riječi (engleski)
speech synthesis
formant synthesis
eSpeak
eSpeakedit
Jezik hrvatski
URN:NBN urn:nbn:hr:190:469993
Studijski program Naziv: Računarstvo Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra inženjer/inženjerka računarstva (mag. ing. comp.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Pristup korisnicima matične ustanove
Uvjeti korištenja
Datum i vrijeme pohrane 2017-01-24 11:08:24