Mrežni korpus za pretraživanje slavenskih jezika – predavanje i radionica

Profesor Karel Jirásek s Katedre za južnoslavenske i balkanske studije Karlova sveučilišta u Pragu predstavio je projekt paralelnoga mrežnog korpusa InterCorp, o kojemu je uvodno bilo riječi i na prošlogodišnjemu, 50. seminaru Zagrebačke slavističke škole. Studirao je hrvatsku i slovensku filologiju, a u istraživačkome su mu fokusu južnoslavenski jezici – sintaksa, leksikologija, dijalektologija te korpusna lingvistika. Jedan je od projekata u kojemu sudjeluje upravo višejezični korpus InterCorp, koji je pokrenut 2005. i sadrži uglavnom beletrističke i publicističke tekstove, filmske titlove i prijevode Biblije na 42 jezika. U predavanju je uputio na rezultate pretraživanja korpusa i kontrastivnoga tumačenja podataka, koji su izrazito korisni za proučavanje lingvističkih fenomena poput jezičnoga posuđivanja te međujezičnih veza i utjecaja na različitim razinama, kao i praćenje jezičnih promjena i inovacija u određenome jeziku pod utjecajem prijevodā.

Nadovezujući se na prošlogodišnje izlaganje, predavač je uz teorijsku podlogu nastojao oprimjeriti pojavu strukturnoga prožimanja različitih jezika čije osobitosti dolaze u izravan kontakt zahvaljujući prevođenju, tj. specifičnomu odnosu između izvornih tekstova i njihovih prijevoda. Taj se odnos u širemu smislu može promatrati kao odnos dvaju jezičnih sustava – polazišnoga i ciljnoga jezika. Ukratko je uputio na temeljne odrednice komparativne i kontrastivne lingvistike, međusobno ih razlučujući: dok je komparativna lingvistika disciplina duge tradicije vezana za izučavanje genetskih odnosa među jezicima (usmjerava se na određene pojave u mnogo različitih jezika), kontrastivna je uglavnom orijentirana na sinkronijska istraživanja te se načelno bavi paralelnim promatranjem pojava u dvama (najviše trima) jezicima. Potonja je zaživjela upravo pojavom jezičnih korpusa, a oni ju ujedno povezuju s translatologijom kao zasebnom disciplinom koja se služi istom građom. Nekoliko je uvodnih riječi posvećeno i translatologiji te teoriji o općim karakteristikama prijevodnoga jezika, koja se početkom tekućega stoljeća većinski napušta. S druge strane, aktualna istraživanja naglasak stavljaju na utjecaj polazišnoga jezika i tekstnih žanrova, što je i glavna teza profesora Jiráseka – svaki prijevod u određenoj mjeri posreduje kvalitete izvornika te na taj način pokreće strukturne promjene u ciljnome jeziku na različitim razinama. Usto pobliže su definirani paralelni korpusi te istaknuti terminološki sporovi između translatologā i lingvistā. Prikazana je i podjela višejezičnih i jednojezičnih korpusa te su elaborirane glavne sfere njihove primjene.

U nastavku predavač je naveo statističke podatke o zastupljenosti izvornih i prijevodnih tekstova u dvama korpusima – Češkome narodnom korpusu i InterCorpu – iz kojih je vidljivo da prevladavaju prijevodi (70–80% svih beletrističkih tekstova povezanih s češkom i hrvatskom sastavnicom korpusa), dok su češki izvornici dominantniji tek kod stručne literature. Struktura hrvatsko-češkoga paralelnog korpusa trenutno obuhvaća 300-ak knjiga, među kojima trećinu čine češki izvornici prevedeni na hrvatski jezik, ali i 170-ak izvornika na trećemu jeziku.

Jedno se od predstavljenih istraživanja odnosi na čestotu i uporabu glagolskoga priloga sadašnjega u hrvatskome i češkome jeziku. U češkome je on danas izrazito rijedak iako, povijesno gledano, nije uvijek bilo tako – u 16. i 17. stoljeću koristio se češće, a u 18. frekventnost opada, no preporodnim vraćanjem na postavke starijega jezika ponovno oživljava u 19. stoljeću. U 20. stoljeću ponovno je vidljiva njegova degradacija, o čemu svjedoče i korpusni podaci iz češke beletristike, u kojoj tijekom prošloga stoljeća broj pojava toga oblika na milijun riječi znatno opada. Stoga, prevođenje češkoga književnog teksta na hrvatski, smatra Jirásek, za sobom povlači i slabije izraženu uporabu glagolskih priloga u hrvatskome (prijevodnome) tekstu bez obzira na činjenicu što je taj oblik u hrvatskome naveliko zastupljeniji. S druge strane, prevođenjem glagolskoga priloga s hrvatskoga na češki uz potencijalno zadržavanje istovrijednoga, no razmjerno rjeđega morfološkog oblika kao mogućnosti se nameću prijevod priložnom oznakom ili sastavnom rečenicom (samostalnim predikatom). Zanimljivi su i češki deverbativni pridjevi, koji se u hrvatskome mogu zamijeniti zavisnom surečenicom, glagolskim prilogom ili kojom drugom vrstom pridjeva. Tek u određenim slučajevima moguća je uporaba hrvatskih deverbativnih pridjeva kao rubne pojave koja uglavnom zahvaća stabilne veze riječi (npr. spavaća soba, brijaći aparat), a ekvivalentno se značenje počesto kodira konstrukcijom za + glagolska imenica. Ipak, u hrvatskim su prijevodima čeških tekstova deverbativni pridjevi češći upravo pod utjecajem polazišnoga jezika. Usputno je spomenuta i problematika utjecaja prijevodā na uporabu suprotnih veznika u hrvatskome, kao i mogućnost identifikacije međujezičnih homonima (tzv. lažnih prijatelja). U obliku vizualnih prikaza projicirani su i različiti rezultati obrade tekstova u korpusu.

Profesor Jirásek predavanjem je potvrdio važnost InterCorpa kao platforme koja može pripomoći u shvaćanju jezičnih pojava, utjecaja i prožimanja. Iako ih počesto izravno ne osvještavamo, ta su prožimanja sveprisutna i pokreću jezične promjene. Nakraju su izlaganja istaknuti i pravci u kojima će se digitalni alati usavršavati, što se tiče, primjerice, adekvatnijega i točnijega prepoznavanja frazema kao cjelovitih značenjskih jedinica složene strukture te homonimā, odnosno izrazā koji su formalno identični, no značenjski nepodudarni, pa mogu predstavljati kamen spoticanja računalnim sustavima.

U večernjim je satima profesor Jirásek u okviru radionice na predstavljenome mrežnom korpusu zainteresiranim polaznicima pokazao kako pretraživati korpus i baratati dobivenim rezultatima. Sudionici radionice samostalno su na računalima zadavali upite te sistematizirali, pohranjivali i tumačili izlazne vrijednosti. Tako su se sami u praksi uvjerili u korisnost toga internetskog alata koji im uvelike može pomoći u istraživanju i rasvjetljavaju mnogih jezičnih pojava. Osim osnovnoga sučelja predstavljena im je i baza prijevodnih ekvivalenata povezana s korpusom InterCorp.

Darko Vasilj

Fotoalbum