Bogunović, I., Jelčić Čolakovac, J. & Borucinsky, M. (2022). Baza engleskih riječi i hrvatskih istovrijednica [Data set]. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, Irena, et al. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet, 2022. 28 Nov 2024. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, Irena, Jasmina Jelčić Čolakovac, and Mirjana Borucinsky. 2022. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, I., Jelčić Čolakovac, J. and Borucinsky, M. 2022. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet. [Online]. [Accessed 28 November 2024]. Available from: https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović I, Jelčić Čolakovac J, Borucinsky M. Baza engleskih riječi i hrvatskih istovrijednica. [Internet]. Pomorski fakultet; 2022, [cited 2024 November 28] Available from: https://urn.nsk.hr/urn:nbn:hr:187:891063.
I. Bogunović, J. Jelčić Čolakovac and M. Borucinsky, Baza engleskih riječi i hrvatskih istovrijednica, Pomorski fakultet, 2022. Accessed on: Nov 28, 2024. Available: https://urn.nsk.hr/urn:nbn:hr:187:891063.
Title (croatian)
Baza engleskih riječi i hrvatskih istovrijednica
Title (english)
The database of English words and their Croatian equivalents
Scientific / art field, discipline and subdiscipline
HUMANISTIC SCIENCES Philology Anglistics
Abstract (croatian)
Ova baza sadrži engleske riječi koje se u hrvatskome pojavljuju u svom izvornom obliku, zadržavajući ortografska obilježja engleskog jezika (npr. show, boxer, zombie, skin, itd.). Popis engleskih riječi temelji se na Bazi engleskih riječi u hrvatskome (Bogunović i Kučić 2022, https://repository.pfri.uniri.hr/islandora/object/pfri%3A2495) te je dodatno nadopunjen riječima dobivenim pretragom korpusa hrWaC (Ljubešić i Erjavec 2011; Ljubešić i Klubička, 2014) pomoću platforme SketchEngine (Kilgarriff i sur. 2004). Ista platforma poslužila je za dodatnu provjeru konačnog popisa engleskih riječi koristeći se konkordancijama I programskim jezikom CQL. Engleski je kontekst uklonjen pomoću Xf taggera, kako bi se ta pojavnost isključila iz konačnih podataka. Podaci su dodatno ručno provučeni kroz korpuse ENGRI (Bogunović i sur., 2021; Bogunović i Kučić, 2021) i hrWaC korpisteći alate slučajnog uzorka i filtriranja kako bi se uklonile riječi koje sadrže npr. imena, lažne kognate, lažne parove, itd. Za svaku riječ dostupna je i hrvatska istovrijednica, ako ista postoji za navedenu englesku riječ, kao i podatak o čestoti pojavljivanja u spomenutim korpusima. Odabir hrvatske istovrijednice temelji se na korpusnim podacima o pojavnosti riječi te dostupnim mrežnim rječnicima hrvatskog jezika. Nadalje, jednorječni i višerječni engleski izrazi prikazani su zasebno radi preglednosti same baze te pojednostavljivanja pretraživanja.
Važno je istaknuti kako ova baza ne sadrži konačne podatke o pojavnosti engleskih riječi u hrvatskom, ali je svakako reprezentativna te ukazuje na trenutni položaj engleskih riječi u hrvatskom jeziku. U planu je postojeću bazu nadopuniti i osuvremeniti novijim tekstovima i podacima.
Abstract (english)
The current database contains English words which appear in Croatian in their original, unadapted form (e.g. show, boxer, zombie, skin, etc.). The list of words is based on The Database of English words in Croatian (Bogunović & Kučić 2022; https://repository.pfri.uniri.hr/islandora/object/pfri%3A2495), and was further complemented with words obtained from the corpus hrWaC (Ljubešić & Erjavec 2011; Ljubešić & Klubička 2014) using the platform SketchEngine (Kilgarriff et al. 2004). The same platform was used to check the list of English words against the corpora ENGRI (Bogunović et al. 2021; Bogunović & Kučić 2021) i hrWaC by consulting concordances and using CQL. The tagger Xf was used to filter out all English sentences embedded in Croatian texts. Corpus results were then manually checked using the random sample and filter tools to remove e.g., proper nouns, false cognate, false pairs, etc. The database also lists Croatian equivalents (and corresponding frequencies in the corpora) for each English word if they exist in Croatian. The choice of the Croatian equivalent depended greatly on the available corpus data on word frequency as well as Croatian online dictionaries. Furthermore, single-word and multi-word English expressions are represented separately in the database for reasons of visual transparency and simplification of word search.
We would like to stress that the database by no means represents a final product and is not a definite representation of data on English words in Croatian, but is, however, representative of their current status in the Croatian language. Further efforts will be made to update the database and incorporate new data.
Number: UIP-2019-04-1576 Title (croatian): Engleske riječi u hrvatskome jeziku: Identifikacija, afektivno-semantičko normiranje i ispitivanje kognitivne obrade bihevioralnim i neuroznanstvenim metodama Acronym: ENGRI Leader: Irena Bogunović Jurisdiction: Croatia Funding stream: UIP
Publisher
Pomorski fakultet Faculty of Maritime Studies, Rijeka