Title (croatian) | Primjena metoda korpusne lingvistike u jezikoslovnim istraživanjima |
Author | Mirjana Borucinsky |
Editor | Vesna Vranić Kauzlarić |
Author's institution | University of Rijeka Faculty of Maritime Studies |
Scientific / art field, discipline and subdiscipline | HUMANISTIC SCIENCES Philology |
Abstract (croatian) | Temeljno je polazište ove knjige da je korpusna lingvistika metodološki pristup koji omogućuje empirijsko istraživanje jezika i jezičnih varijeteta a rezultati dobiveni korpusnim metodama imaju veću valjanost od onih do kojih se došlo intuicijom, refleksijom ili promišljanjem. Poznavanje teorijskih postavki korpusne lingvistike, kao i mogućnosti i funkcionalnosti postojećih računalnojezikoslovnih resursa i alata, korisnicima će olakšati interpretaciju podataka dobivenih iz korpusa te rasvijetliti jezične pojave koje istražuju. Naslanjajući se na Stefanowitscha (2020: 1) korpusnu lingvistiku smatramo vrstom lingvističkoga propitivanja koje se temelji na podacima dobivenima iz korpusa (Stefanowitsch 2020: 1). Drugim riječima, korpusna lingvistika je način pronalaženja odgovora na jezikoslovna istraživačka pitanja utemeljena na cjelovitoj i sustavnoj analizi načina na koji su jezične pojave distribuirane u jezičnome korpusu (Stefanowitsch 2020:55, prev. a.).1 Motivacija za radom na korpusima nastala je prilikom izrade doktorske disertacije (Borucinsky, 2015) u kojoj su ispitivane sintaktičke strukture u tadašnjemu jedinom slobodno dostupnom korpusu hrvatskoga općeg jezika – Hrvatskome nacionalnom korpusu (HNK). Sintaktičke strukture predstavljaju jedan od najvećih izazova u korpusnim istraživanjima pa se korisnik, unatoč dostignućima korpusne lingvistike i razvoju jezičnih tehnologija, često nađe pred zidom prilikom istraživanja jer mu je potrebna funkcionalnost koju postojeći alati ne pružaju. Dok se većina jezikoslovaca slaže oko načina lematizacije i označavanja vrsta riječi, označavanje sintaktičkih kategorija u pravilu polazi od neke teorije, što znači da je teško postići konsenzus oko označavanja sintaktičkih kategorija. Nadalje, u korpusu pronalazimo tipične i karakteristične jezične obrasce pa se jezikoslovci prilikom pretrage manje tipičnih obrazaca, kao što su, primjerice, sintaktičke kategorije (npr. imenska skupina) ili pak engleske ili strane riječi u korpusu hrvatskoga jezika, moraju dovinuti različitim načinima kako da dobiju valjane podatke iz korpusa. Nadalje, jezikoslovci u pravilu nisu programeri, pa im je stoga potrebna podrška informatičara u razvoju resursa. Ova knjiga napisana je iz perspektive korisnika korpusa u nadi da će postavljena pitanja i kritički osvrt na mogućnosti postojećih alata doprinijeti razvoju jezičnih tehnologija za hrvatski jezik. U knjizi se, dakle, preispituju mogućnosti dostupnih računalnojezikoslovnih alata i resursa za hrvatski jezik, koji pripada jezicima sa slabije razvijenim jezičnim tehnologijama. S obzirom na to da korpusi omogućuju uvid u jezik kojemu se ne može pristupiti izravno, već samo preko njegova ostvaraja, postavlja se i pitanje mogu li se korpusni podaci adekvatno ponoviti i mjeriti. Ovaj problem preispituje se iz nekoliko perspektiva. Knjiga je prvenstveno zamišljena kao studija prednosti i nedostataka metoda korpusne lingvistike u obradi hrvatskoga jezika. Uz to se ukazuje i na potrebu za interdisciplinarnim pristupom proučavanju jezika te daljnjim obrazovanjem i usavršavanjem jezikoslovaca u području korpusne lingvistike. Korpusna lingvistika kao disciplina nije zastupljena u Hrvatskoj, i na mnogim se sveučilištima u Hrvatskoj ne poučava na studijima filoloških usmjerenja, primjerice, na Sveučilištu u Rijeci, iako je potreba za takvim kolegijem prepoznata. Iskorak u tom smislu učinio je B. Perak razvojem mikrokvalifikacije Jezične tehnologije i digitalna obrada teksta koja je zamišljena kao strukturirani program koji uključuje ponudu niza kolegija različitih sastavnica Sveučilišta u Rijeci i njihovih studijskih programa, između ostaloga, i kolegij Korpusna lingvistika. Kao pokazatelj da korpusna lingvistika nije rasprostranjena u Hrvatskoj možemo navesti jedan diplomski rad u kojemu se, između ostaloga, raspravlja o položaju korpusne lingvistike u Hrvatskoj. Naime, Hasanić (2017) je istražio položaj korpusne lingvistike među studentima preddiplomskoga, diplomskoga i poslijediplomskoga studija filologije, te nekoliko doktora znanosti, i onima koji su stekli neki stupanj obrazovanja u lingvistici, posebno se osvrnuvši na prednosti korpusne lingvistike kao istraživačkoga alata za proučavanje vokabulara, jezičnih uzoraka i obrazaca te semantičke interpretacije i gramatičkoga aspekta jezika. U tu svrhu proveo je anketno istraživanje u kojem je sudjelovalo 100 ispitanika kako bi utvrdio u kojoj su mjeri upoznati s korpusima i njihovom uporabom. Rezultati su pokazali da 60 % ispitanika nije imalo doticaj s niti jednim oblikom organizirane izobrazbe o korpusnoj lingvistici a 80 % ih nikada nije odslušalo kolegij iz korpusne lingvistike, no gotovo 60 % njih služi se korpusnim alatima i metodama u obrazovanju ili na radnome mjestu. Najveći postotak, točnije 60 % ispitanika koji se služe korpusnim alatima i metodama spada u dobnu skupinu od 20 do 29 godina. 15 Uvodna riječ Ovo istraživanje provedeno je davno i na malom uzorku koji nije reprezentativan, no ipak je svojevrsni pokazatelj nezastupljenosti korpusne lingvistike u Hrvatskoj. |
Keywords (croatian) | |
Language | croatian |
Publication type | Authored book-Scientific book-Scientific monograph |
Publication status | Published |
Peer review | Peer review - domestic |
Publication version | Published version |
Edition | 1 |
Pages | 191 |
ISBN | 978-953-165-140-0 |
URN:NBN | urn:nbn:hr:187:321474 |
Printed book publication date | 2023 |
Type of resource | Text |
Publisher | Sveučilište u Rijeci, Pomorski fakultet |
Publishing place | Rijeka |
Access conditions | Open access |
Terms of use | |
Created on | 2023-09-04 09:24:27 |