Kako se lotiti novega slovarja slovenskega jezika?

Slovarji so vedno imeli izrazito simbolno vlogo, kar samo po sebi ni problematično, če ni zanemarjena praktična uporabnost.

Objavljeno
04. oktober 2013 15.38
Pogledi slovar 5.6.2013 Ljubljana Slovenija
Simon Krek
Simon Krek

Pri razmisleku o novem slovarju se postavlja vrsta dilem, kako se takega projekta lotiti na pravi način. Nekatere od njih izhajajo iz zunanjih okoliščin, kakršne so denimo bliskovita globalizacija ter razvoj informacijsko-komunikacijskih in drugih tehnologij. Druge vrste dilem izhajajo iz naših specifičnih okoliščin, predvsem iz načina, kako imamo organizirano infrastrukturo, ki naj bi govorcem slovenščine zagotavljala vire, orodja in servise, ki jih v novih časih potrebujejo za dejavnosti, povezane z jezikom.

O državni organiziranosti jezikovne infrastrukture govori nova Resolucija o nacionalnem programu za jezikovno politiko: »Država zagotavlja zbiranje, obdelovanje in trajno dostopnost zanesljivih slovničnih, slovarskih in stilskih informacij o vseh pojavnih oblikah slovenščine, še posebej o knjižnem jeziku kot njeni standardni in povezovalni različici.« Če se vprašamo, kdo konkretno je »država«, lahko v istem dokumentu najdemo navedbo subjektov, ki to dejavnost financirajo in izvajajo. Financerji so ministrstvo za izobraževanje, znanost in šport, ministrstvo za kulturo in javna agencija za raziskovalno dejavnost (ARRS). Kot izvajalci dejavnosti pa so naštete tri skupine ustanov: Slovenska akademija znanosti in umetnosti, slovenske univerze in raziskovalne ustanove. Akademija je z enim obrazom tudi na financerski strani, hkrati pa je kot ustanoviteljica Znanstvenoraziskovalnega centra SAZU (ZRC SAZU), v okviru katerega deluje Inštitut za slovenski jezik Frana Ramovša (ISJFR), na izvajalski strani. Ta inštitut je osrednja slovenska raziskovalna ustanova, ki skrbi tako za raziskave slovenskega jezika kot za njegovo infrastrukturo, financira jo večinoma ARRS, deloma SAZU.

Prvi nesporazum: komu ali čemu je slovar namenjen?

Težavi s SSKJ ter njegovo rabo kot vira pomenskih informacij o sodobni slovenščini sta dve. Prvič, slovar je zastarel. Nastajal je od sredine prejšnjega stoletja do l. 1991 na gradivu, izpisanem na listkih, ki je bilo še starejše. To pomeni, da imamo trenutno opisano le slovenščino, kakršna je bila v rabi nekje od začetka prejšnjega stoletja do sredine ali malo čez. Če se želimo poučiti o sodobnih pomenih besed, ta slovar danes težko uporabimo, razen kot zgodovinski vir, saj tudi za še aktualne pomene ne moremo biti prepričani, ali ustrezajo sodobni rabi ali ne. In drugič, slovar je težko razumljiv, tako za splošno publiko kot za tisto, ki bi ga pri usvajanju jezika najbolj potrebovala: za šolsko populacijo. To so znana in (znanstveno) dokumentirana dejstva, o katerih ni treba izgubljati besed. Tudi letos objavljeni Slovar novejšega besedja (SNB), trenutno dostopen zgolj v knjižni obliki, skoraj v celoti sledi leksikografski metodologiji SSKJ, ki je v evropski in svetovni leksikografiji že presežena, zato kombinacije obeh omenjenih slovarjev, ki bo izšla naslednje leto kot SSKJ-II, ne bo mogoče vzeti za izhodišče novega slovarja, ali bolje, digitalne slovarske baze, kakršno bomo potrebovali v prihodnosti. Ta baza bo morala omogočiti črpanje raznovrstnih informacij o slovenščini in njihovo vizualizacijo za različne tipe uporabnikov, od učencev do znanstvenikov.

Slovarji so vedno imeli tudi izrazito simbolno vlogo, kar samo po sebi ni problematično, če ni zanemarjena druga ključna vloga jezikovnega priročnika: praktična uporabnost. Vsi znani načrti IJSFR kažejo, da se zaveda predvsem simbolne vloge slovarjev, zanemarja pa vsakdanjo rabo, pri čemer kot alibi za svoj leksikografski avtarkizem uporablja pojem znanstvenosti. Da so informacije za običajnega uporabnika nerazumljive, še ne pomeni, da so znanstveno zanesljive, kot tudi znanstvena zanesljivost ne pogojuje nerazumljivosti. Zanesljivost informacij in znanstvenost je bila pri slovarjih vedno pogojena z analizo velikih količin podatkov, bodisi ročno, kot nekoč, zdaj pač strojno.

Med ciljno publiko je treba upoštevati tudi novega uporabnika, ki ignorira simbolno vlogo slovarjev, po drugi strani pa hlepi po slovarskih podatkih, ki jih ne potrebuje nihče drug. Že od 19. stoletja se leksikografi pritožujejo, da ogromno časa porabijo za izdelavo iztočnic, ki so sicer najbolj pogoste v jeziku, a si jih v slovarju nikoli nihče ne ogleda – ker vsi vemo, kaj te besede pomenijo. Sodobna računalniška obdelava jezikov je s svojimi praktičnimi aplikacijami v zadnjih letih prišla do točke, ko se je treba lotiti tudi računalniškega razvozlavanja pomenskih informacij ali, strokovno rečeno, semantičnega razdvoumljanja besed v sobesedilu. Za uporabo te tehnologije je treba imeti na voljo slovar določenega jezika v obliki, ki je računalniško berljiva in prosto dostopna – z vsemi besedami, ki si jih ljudje ne ogledujejo.

Ta tehnologija je pomembna za številne računalniške aplikacije, od črkovalnikov, strojnega prevajanja, razpoznave govora do umetne inteligence na skrajnem koncu. Skratka, semantično razdvoumljanje postaja ena od temeljnih tehnologij, ki jo bo treba zagotoviti za vsak jezik, ki bo sploh zmogel prehod v digitalno dobo. Pomembnosti tega prehoda preprosto ni mogoče dovolj poudariti in je po teži verjetno primerljiv z vzpostavljanjem knjižne slovenščine v 16. stoletju. Za omenjeno (računalniško) rabo velja, da je treba imeti slovarsko bazo, kompatibilno s tistimi za druge jezike, strojno berljivo, aktualno, redno obnavljano in prosto dostopno. Po drugi strani seveda velja tudi: vsaka baza je boljša kot nobena baza. Dejstvo, da že obstoječa SSKJ in SNB nista prosto dostopna kot računalniški bazi, pove marsikaj o lastniku (ZRC SAZU) in njegovem razumevanju lastne vloge kot javnega servisa, ki ga financiramo davkoplačevalci.

Drugi nesporazum: kaj sploh je slovar?

Nekoč je bil odgovor na to vprašanje preprost – slovarji so bili debele knjige, delili so se po različnih kriterijih: enojezični/dvojezični, historični/sinhroni, specializirani/splošni itd. Ko so v 90. letih prejšnjega stoletja računalniki začeli preplavljati domove, so se slovarji v vsebinsko izvorni obliki preselili na diskete in cederome, le medij je postal drug. Računalniki v tistem času niso toliko vplivali na končni videz slovarjev, saj so založniki slovarje še vedno predvsem tiskali.

Tudi prvi splet – množica portalov z enosmernim komuniciranjem – se slovarjev vsebinsko ni močno dotaknil. Takrat se je prvič pojavila možnost, da en vir na preprost način lahko doseže zares veliko število uporabnikov in javno financirani slovarji evropskih jezikov so množično stopali na splet kot prosto dostopni slovarski portali, med drugim l. 2000 tudi SSKJ in šele l. 2010 tudi pravopisni slovar. (Da letos izdani SNB ni prosto dostopen na spletu, žal lahko pripišemo zgolj komercialnim nagnjenjem naše raziskovalne ustanove, ki želi pred neizogibno spletno objavo od kupcev iztisniti še kak evro.) A dokler so se na spletu objavljale digitalizirane verzije kvalitetnih in avtoritativnih knjižnih slovarjev, tudi ta razvoj ni vplival na organizacijo vsebine. Resnična sprememba, zaradi katere sploh moramo razpravljati o tem, kako se nacionalnega slovarskega projekta lotiti na pravi način, je sledila s spoznanjem pred nekaj leti, da bomo slovarje kmalu prenehali tiskati, razvoj na tem področju pa bodo določale nove možnosti računalniške obdelave informacij in elektronskih medijev. Kako se je to zgodilo?

Drugo inkarnacijo spleta opredeljuje predvsem sodelovanje uporabnikov pri oblikovanju spletnih vsebin, interaktivnost in omogočanje množičnega komuniciranja v obliki družabnih omrežij. Za naš namen najboljši zgled tega razvoja predstavlja ena od uspešnejših zgodb spleta 2.0 – Wikipedija. Kot vemo, je bil format Wikipedije narejen za splet, na njem živi s pomočjo množičenja (crowdsourcing) in njen prenos v tiskano in vezano formo (razen priložnostnega tiskanja posameznih člankov) je preprosto nesmiseln. Absurdnost te ideje dobro ponazarja zadrego sodobnih slovaropiscev. Kaj se zgodi, ko zanesljivo sidrišče in hkrati prisilni jopič tiskane forme umanjka? Ko se nenadoma znajdemo pred možnostjo uporabe skoraj neomejenih procesorskih moči in spominskih kapacitet v računalniškem oblaku? Kako bomo organizirali podatke o jeziku, ki bi lahko zanimali uporabnike, in to prav VSE podatke, če je meja samo (računalniško) nebo?

Kdaj je v slovarskem svetu spoznanje o radikalnem prehodu v digitalni medij dokončno prevladalo, je težko reči, a vsaj od leta 2009, ko je bila organizirana prva konferenca E-lexicography in the 21st century, lahko rečemo, da se evropski leksikografski svet tega zaveda v celoti in intenzivno išče pravi odgovor na to vprašanje. Ta trenutek lahko rečemo, da univerzalnega odgovora še ni, že vsaj od omenjenega leta pa pri drugih jezikih potekajo slovarski projekti, ki so zapustili knjižno formo in uporabnikom skušajo ponuditi več informacij o jeziku na povsem drugačen način. Poleg same količine je bistveno, da so te informacije lahko podane bolj kakovostno in da so prilagojene raznovrstnim potrebam različnih uporabnikov. S svojo brezkompromisno stavo na pretečeni koncept SSKJ-SNB pa je ISJFR v zadnjih letih zamudil dobro priložnost za vključitev v nove leksikografske tokove z drugačnimi potrebnimi znanji. Ta znanja so pridobili strokovnjaki na drugih ustanovah, ki so s tem postale nujni dejavnik pri oblikovanju koncepta morebitnega drugačnega, v osnovi digitalnega slovarja, primernega za tretjo verzijo spleta, ki mu pravijo tudi – semantični splet.

Tretji nesporazum: kdo in kako naj naredi slovar?

Če je torej SNB izdelek, ki uteleša trenutno leksikografsko znanje, zbrano na ISJFR, smo lahko zaskrbljeni, saj je očitno, da ni sinhroniziran z naprednejšo evropsko prakso – ki je sicer sama še v iskanju ustrezne digitalne forme, vemo pa, da bo ta zgolj v jedrnih elementih spominjala na knjižne slovarje. Tega znanja in vpetosti v evropski leksikografski prostor na ISJFR trenutno ni. Drugi razlog za skrb je ta, da nove leksikografske metode omogočajo veliko bolj racionalno delo, kot je bilo mogoče v časih »ročne« izdelave. Če si ogledamo letna poročila ISJFR in iz navedb, kdo je delal pri katerem projektu, čez palec izračunamo, koliko denarja smo porabili za izdelavo SNB, ob zelo konzervativni oceni pridemo do številke 2 milijona evrov – za 6399 gesel. To je zelo razkošna številka. Za nov slovar s približno 100.000 gesli bi torej potrebovali čez 30 milijonov evrov. Ob upoštevanju novih tehnoloških možnosti in z drugačno organizacijo bi bilo mogoče nov slovar narediti za približno sedemkrat manjšo vsoto. V zgornjo vsoto je denimo vštet tudi raziskovalni projekt izdelave geslovnika za SNB, ki nas je stal 160.000 evrov. Po strokovni oceni bi s pomočjo novih tehnologij lahko dva človeka enako delo namesto v treh letih opravila v največ treh mesecih – za do desetkrat manjšo vsoto.

Nadaljnji problem, ki postavlja pod vprašaj trenutno organiziranost slovaropisnih dejavnosti v Sloveniji, je v temelju projektna izvedbena narava vsakega slovarskega projekta. Preprosto rečeno, to pomeni, da mora za uspešno dokončanje vsak slovarski projekt imeti organizacijski, terminski in kadrovski načrt, s tem povezan vnaprej znan proračun, ter najpomembnejše: navodila za izdelavo, po katerih lahko konsistentno in enotno delajo vsi člani slovarske ekipe. Da bi to lahko bolje pojasnili, se moramo vrniti na opis, kako država trenutno financira izdelavo slovarskih virov.

ARRS, državno posredniško telo za razdeljevanje raziskovalnih sredstev, deli financiranje na »stabilno« in »tekmovalno«. Stabilno financiranje poteka prek raziskovalnih in infrastrukturnih programov, ki so razmeroma ohlapno evalvirani vsake štiri, pet ali šest let, pripadajo pa vnaprej določeni instituciji, ki izvaja specifičen program. Za svoje naloge ISJFR vsako leto dobi med 600.- in 700.000 evrov v okviru programa Slovenski jezik v sinhronem in diahronem razvoju . To so sredstva, ki na inštitut pridejo ne glede na to, kdaj in na kakšen način izda konkretne slovarje, ali so ti skladni s primerljivimi jezikovnimi viri v evropskem okviru itd. Programi so torej neke vrste raziskovalna bianko menica, ki je namenjena temu, da raziskovalci na nekem področju vnaprej vedo, da se financiranje njihovih raziskav ne bo nenadoma kar ustavilo ter se bolj kot tekmi za projekte in preživetje lahko posvetijo raziskovanju.

Težavi pri tej vrsti državnega razmišljanja v zvezi s financiranjem slovarjev sta dve. Prvič, pri procesu izdelave slovarjev, torej pri vsakodnevnem izpolnjevanju norme izdelanih gesel, v precejšnjem deležu sploh ne gre za znanstveno raziskovanje per se. Ko izdelujemo geselske članke, kot slovaropisci preprosto sledimo navodilom, ki so bila izdelana na začetku projekta. Nedvomno je pri izdelavi slovarskega koncepta in pri določnem številu mikroodločitev močno prisotna znanstvena komponenta in ta se potem lahko izkazuje z objavljanjem znanstvenih monografij ali člankov na izbrane teme. Velika večina slovarskega dela pa je razmeroma rutinska. Prisilno tlačenje slovarskega dela v okvir zgolj znanstvenega raziskovanja ima lahko katastrofalne posledice. To pomeni, da bomo slovar tako rekoč samodejno zapeljali na pot nerazumljivosti, samozadostnosti, z jezikoslovci kot primarno, če ne celo edino ciljno publiko, rutinska slovarska dela pa bodo opravljali precej previsoko kvalificirani doktorji znanosti. O tej težavi dovolj jasno govori ves trud inštituta, da bi ARRS slovarje klasificirala kot znanstvena dela, in dolgoletno upiranje ARRS, da bi to priznala. Z dobrim razlogom: s tem bi diskreditirali znanstveno in raziskovalno delo drugih raziskovalcev. Rešitev je, paradoksalno, razmeroma preprosta – rutinsko slovarsko delo bi bilo treba osvoboditi prisilnega raziskovalnega jopiča in ločiti raziskovalno seme od slovaropisnega zrnja. Ali preprosteje – to pomeni, da bi se morali raziskovalci, ki jih plača ARRS, dejansko ukvarjati z znanstvenim raziskovanjem, izdelovanje konkretnih slovarjev pa bi moralo dobiti drugačen organizacijski okvir, v katerem slovaropisci ne bi bili obremenjeni z nabiranjem znanstvenih točk in dokazovanjem, da so znanstveniki, če so v resnici leksikografi, izdelovalci slovarskih gesel. Kombiniranja obeh dejavnosti v okviru istega projekta ob drugačni organiziranosti ne bi bilo tako težko doseči.

Druga težava trenutne organiziranosti slovarskega dela je v tem, da ravno zaradi neobvezne narave »stabilnega« financiranja sistem na ravni države ni zastavljen tako, da bi zagotavljal časovno in finančno predvidljive rezultate. Če želimo izdelati slovar v optimalnem času in s čim bolj racionalno rabo sredstev, je nujno, da je proces izdelave zastavljen projektno in da so v jasno definiran projekt vključeni vsi akterji po različnih ustanovah ali izven njih, ki lahko ta hip s svojim znanjem, voljo in pripravljenostjo najbolje prispevajo k optimalni izvedbi. Ti so tako jezikoslovci – leksikografi, etimologi, terminologi, jezikovni tehnologi – in drugi raziskovalci na ZRC SAZU, na univerzah in drugih raziskovalnih ustanovah kot tudi samostojni leksikografi, učitelji, študenti in vsi drugi, vsak s svojo vlogo, v kateri lahko najbolje prispevajo k skupnemu cilju. Financiranje izdelave slovarja ne sme biti omejeno zgolj na sredstva ARRS, temveč je za tisto slovarsko delo, ki po svoji naravi ni znanstvenoraziskovalno, treba zagotoviti drugačen finančni in organizacijski okvir. V kriznih časih je to težko, zato bi bili strukturni skladi verjetno najprimernejši finančni vir za tak projekt, kar priporoča tudi EU.

Širše gledano pa je ena od nalog države v prihodnjih letih tudi ta, da poskrbi za vzpostavitev (mednarodno vpetega) vozlišča prosto dostopnih virov, informacij in storitev v zvezi s slovenščino. To vlogo naj bi načeloma imel ISJFR, vendar je ne opravlja. Če se stanje ne bo kmalu izboljšalo, bo treba poskrbeti tudi za to, da se takšno vozlišče vzpostavi na eni od drugih javnih ustanov. Sicer bo naš jezik realno na srednji rok postal ogrožen: ne zaradi vdorov angleščine in podobnih praznih strahov, temveč zato, ker zanj nismo znali poskrbeti sami.

***

Simon Krek, Institut Jožefa Stefana in FDV Univerze v Ljubljani