SSKJ danes in jutri, potem pa …

O pomankljivostih in dobrih zamislih trojice oziroma o ljudski modrosti, ki pravi: Ko ne veš, za kaj gre, gre za denar.

Objavljeno
20. september 2013 11.59
Marko Snoj
Marko Snoj
Proti koncu letošnje pomladi so dr. Simon Krek, dr. Iztok Kosem in dr. Polona Gantar na spletnih straneh zasebnega zavoda Trojina objavili Predlog za izdelavo Slovarja sodobnega slovenskega jezika, ki naj bi nasledil naš temeljni enojezični razlagalni Slovar slovenskega knjižnega jezika. Predlog predvideva izdelavo samo spletno in mobilno dostopnega slovarja, narejenega popolnoma na novo s korpusnim pristopom v petih letih, za katerega naj bi davkoplačevalci odšteli le 4,2 milijona evrov.

Pobuda navedenih treh jezikoslovcev je nastala mimo prizadevanj Inštituta za slovenski jezik Frana Ramovša ZRC SAZU, ki od ustanovitve dalje kontinuirano skrbi za opremljenost slovenskega jezika s temeljnimi jezikovnimi priročniki. Na inštitutu so namreč v preteklih desetletjih nastali vsi temeljni in mnogi aplikativni slovarski priročniki slovenskega jezika. Večina teh del je poleg v knjižni obliki prosto dostopna tudi na spletu v digitalni. Ko govorimo o splošnem slovaropisju, imam v mislih predvsem Slovar slovenskega knjižnega jezika in njegovo dopolnilo Slovar novejšega besedja slovenskega jezika. Ta bo skupaj s preostalimi dodatki in popravki vkomponiran v drugo izdajo Slovarja slovenskega knjižnega jezika, ki jo v knjižni in elektronski obliki načrtujemo prihodnje leto. Ko k temu prištejemo še Slovenski pravopis, terminološke, etimološke in zgodovinske slovarje ter lingvistični atlas, pri čemer so ta dela teoretično podprta s skoraj sto naslovi znanstvenih monografij in več kot tisoč znanstvenih člankov, ugotovimo, da smo glede na opremljenost svojega jezika z opisnimi in normativnimi priročniki primerljivi z večino srednjeevropskih narodov. Slovaropisno delo na Inštitutu za slovenski jezik je tako v preteklosti kot danes sledilo sodobnim jezikoslovnim in slovaropisnim trendom. Glavni gradivni vir za splošno slovaropisje je bil nekdaj v obliki 6-milijonske listkovne kartoteke in ustreznih kartotečnih postopkov, danes so to besedilni korpusi slovenskega jezika in ustrezni jezikovnotehnološki postopki, redakcija pa poteka z uporabo vrhunskega leksikografskega programa. Slovarska vsebina in njen prikaz kakovostno napredujeta skladno z razvojem vseh za slovaropisje pomembnih jezikoslovnih področij in usmeritev, od fonetike prek pomenoslovja, frazeologije in normativistike, vključno s terminologijo, do etimologije.

Druga izdaja SSKJ bo premostila časovno vrzel do novega temeljnega razlagalnega slovarja, prilagojenega sodobnemu jezikovnemu uporabniku, v katerem bo uporabnik našel vse ali vsaj večino verodostojnih podatkov o našem besedju, torej nabor sodobnih slovenskih besed z izgovarjavo in vsemi (dinamično in tonemsko) onaglašenimi stranskimi oblikami pregibnih besed, vključno s slogovno in časovno označenimi ali neoznačenimi dvojnicami, pomenske razlage, sinonime, vezljivostne podatke, slovnične, slogovne, časovne in terminološke kvalifikatorje, sodobno ponazarjalno gradivo, stalne besedne zveze, prikaz in razlago frazemov, besedotvorne in etimološke podatke ter še marsikaj drugega.

Žena, maček in bor

Predlog trojice jezikoslovcev iz prvega odstavka se odlikuje po uporabi nekaterih Inštitutu za slovenski jezik nedostopnih jezikovnotehnoloških orodij, ki naj bi delovni proces pohitrila in rezultate izboljšala, ter po uporabniku prijaznejši vizualizaciji slovarskih vsebin, vse njegove šibke točke pa je težko dokončno oceniti, saj 150 strani dolgo besedilo, ki opredeljuje predvsem slovaropisne postopke, organizacijo dela in finančni načrt, ni slovarski koncept. Iz prikaza osmih večinoma ne v celoti predstavljenih vzorčnih geselskih sestavkov pa lahko sklenemo, da po tem predlogu nastali slovar ne bi bil temeljni.

Temeljni slovar je namreč na znanstvenih metodah zasnovani slovar, ki (1) izhaja iz primarnih virov, v primeru splošnega slovarja torej ustreznih besedil, (2) prinaša skladno s stopnjo razvoja različnih jezikoslovnih področij in usmeritev zanesljive podatke in interpretacije in (3) je obsegovno čim bolj popoln. Od naštetih parametrov predlog trojice izpolnjuje le prvega, pa še tega pogojno, saj besedilni korpus Gigafida, ki je njegov poglavitni vir, žanrsko ni uravnotežen. Obsega namreč le dva odstotka leposlovnih in le štiri odstotke (poljudno)znanstvenih besedil, v njem prevladujejo publicistične objave (77 odstotkov), vsebuje pa tudi vse preveč slogovno zares šibkih spletnih stvaritev, namreč 16 odstotkov, med katerimi se najdejo celo besedila ali deli besedil v angleščini, hrvaščini in srbščini.

Sklepajoč po Spletnem slovarju slovenskega jezika z 2500 iztočnicami, ki je nastal v okviru projekta Sporazumevanje v slovenskem jeziku, pri katerem je delo vodila soavtorica predloga trojice (sicer zaposlena na Inštitutu za slovenski jezik), se postavlja tudi vprašanje, ali se ugotavljanje pomenov posameznih besed lušči neposredno iz gradiva ali s škiljenjem na SSKJ. V Spletnem slovarju slovenskega jezika je namreč beseda maček pomensko opredeljena kot »domača žival«, »zrel in izkušen človek« in »slabo počutje« (pustimo ob strani dejstvo, da ni vsaka domača žival že maček, da zrela in izkušena ženska tudi ni maček in da slabo počutje zaradi prehlada prav tako ni maček), kar vse in še več, vendar mnogo natančneje, prinaša že SSKJ, manjka pa pomen »pleskarski valjček«, ki ga SSKJ še ni zaznal in smo ga prvič uslovarili v letos objavljenem Slovarju novejšega besedja slovenskega jezika. Pričakovali bi, da bi avtorji Spletnega slovarja slovenskega jezika novi pomen izluščili iz besedilnega korpusa Gigafida, kjer se pojavlja v več primerih, npr. v povedi Na vrhu lojtre pa Matevž z mačkom v eni in kanto z barvo v drugi roki. V vzorčnih geslih, ki jih prikazuje predlog trojice, najdemo tudi vse preveč faktičnih napak, tako da slovar, izdelan po tem predlogu, ne bi bil zanesljiv – zanesljivost informacij pa je verjetno najpomembnejše pričakovanje uporabnika temeljnega slovarja.

Naj omenim le eno izmed več takih napak. V vzorčnem geslu žena je navedeno, da je ta beseda v slovenščini prvič zapisana v Dalmatinovi Bibliji leta 1584, čeprav je bila natisnjena že v Trubarjevem Katekizmu iz leta 1550, prvič pa je bila zapisana že v Rateškem rokopisu iz druge polovice 14. stoletja. Ta napaka ni naključna, temveč jo narekuje temeljna usmeritev predloga trojice, ki je upoštevanje le izbranih digitalnih virov. Ker sestavljavec gesla žena v spletni zbirki Jezikovni viri starejše slovenščine, ki obsega le nekaj odstotkov naših starejših besedil, ni našel nobenega starejšega zapisa obravnavane besede, je preprosto povzel, da je navedeni najstarejši. Točne podatke o starejših zapisih te besede bi sestavljavec lahko prepisal iz ustreznih knjig, vendar listanja po knjigah predlog trojice ne predvideva, zato po tem predlogu zasnovani slovar ne more vsebovati podatkov, ki so dostopni le v tiskani in ne tudi digitalni obliki.

Teoretično vprašljivo je tudi enačenje enakopisnic in večpomenskih besed, kot ga predvideva predlog. Tako bo npr. dve besedi z izrazno podobo bor (prva pomeni »drevo«, druga »kemijski element«) slovar prikazoval na enak način kot večpomenski samostalnik maček. Ker se avtorji predloga sklicujejo na intuitivnost pri uporabi slovarja, iz takega prikaza intuitivno sklepam, da je bor ena beseda s prvim pomenom »drevo« in drugim »kemijski element«, kar seveda ni res. Slovenščina ima dve besedi bor, od katerih prva pomeni »drevo«, druga pa »kemijski element«. Najbolj površinski dokaz tej trditvi je, da besedo bor s pomenom »kemijski element« nekateri še izgovarjajo z ozkim ó, torej drugače kot poimenovanje drevesa, ki ga izgovarjamo s širokim. Sledeč temu načelu, bo tudi geslo bučen v slovarju samo eno in bo imelo dva pomena: »hrupen« in »nanašajoč se na bučo«. Po jezikoslovnih spoznanjih, ki jih poučujejo tudi v naših osnovnih in srednjih šolah, gre tu za dve besedi, ki se pri tonemskih govorcih celo razlikujeta v naglasu, prva ima nizkega, torej akutiranega, druga pa visokega, torej cirkumflektiranega.

Medmet kot nosilec pomena

Morda se bodo komu zdele te podrobnosti za vsakdanjo rabo odveč in morda je res tako, vendar pa sta zanesljivost in globina opisa teh in še mnogo takih podrobnosti za temeljni slovar neizogibni. Ignoriranje teh in takih znanstvenih resnic si lahko privošči kvečjemu kak specialni, za določene namene napisani slovar, temeljni pa nikakor ne. Temeljni slovar slovenskega jezika si prav tako ne more privoščiti popolnega ignoriranja tonemskega naglasa, ki je skoraj tako močna posebnost slovenščine kot naša dvojina, samo manj govorimo o njem. Tretja značilnost temeljnega slovarja je njegova težnja k popolnosti. Druga izdaja SSKJ bo imela približno 100.000 geselskih sestavkov, torej toliko, kot jih predvideva predlog trojice. Vendar predlog trojice v to število prišteva tudi nezanemarljivo število večbesednih iztočnic tipa državni zbor, ki so v SSKJ obravnavane na mikrostrukturni ravni pod enobesednimi iztočnicami, poleg teh pa še nekaj lastnoimenskih, ki zaradi pomenske izpraznjenosti ne spadajo v splošni razlagalni slovar. Če v drugi izdaji SSKJ preštejemo tudi podiztočnice in razlage, ki pomensko opredeljujejo večbesedne leksikalne enote, dobimo številko 175.000, kar krepko presega zastavljeni cilj trojice, v katerem je celo zapisano, da bo načrtovani slovar obravnaval samo polnopomenske besede (samostalnike, glagole, pridevnike in prislove – ob tem avtorji pozabljajo, da so nosilci pomena in že zato potrebni slovarske obravnave tudi medmeti, členki in povedkovniki ter da so lastna imena pomensko prazna), zavestno pa izpuščajo števnike, zaimke, veznike in predloge, ki so najpogosteje rabljene besede slovenskega jezika. Bomo torej naš temeljni enojezični slovar in vse prednosti, ki jih pri pisanju novega prinašajo več kot polstoletne institucionalne izkušnje in pridobljeno znanje, zamenjali z manj zanesljivim in manj obsežnim, posledično torej manj uporabnim slovarjem, ki ga bo treba tudi po zaključku redakcije nenehno dopolnjevati, nadgrajevati in vse to plačevati iz javnega denarja? Zdi se, da je ob ustreznem piaru danes mogoče prav vse. Če se bo tehtnica nagnila v to stran, bomo v prihodnjem obdobju obsojeni na slovar z nezanesljivimi in nepopolnimi podatki, ko pa bo šlo zares, npr. pri prevajanju, v šolah, pri branju naših literarnih klasikov in besedil 20. stoletja, v znanstvenem jeziku, na sodiščih, bomo natančnejše pomenske razlage in vse drugo še vedno iskali v časovno vedno bolj odmaknjenem Slovarju slovenskega knjižnega jezika, ki ga ne bo nihče več nadgrajeval in izpopolnjeval, saj država ne bo financirala dveh slovarjev, ki naj bi služila istemu namenu.

Leksikografske kompetence in poslovni interesi

Metodološka nezadostnost za izdelavo temeljnega slovarja se kaže še v eni usmeritvi predloga trojice, tj. v izključni uporabi korpusnega pristopa. Korpusni pristop je seveda koristen in uporaben, vendar (še) ni dorasel vsem slovaropisnim opravilom. Predlog omeji opis besedja na to, kar omogočajo izbrani digitalni viri in današnja tehnologija. S tem izloči mnogo podatkov in jezikoslovnih spoznanj zadnjih dvesto let in prekine s slovensko (in srednjeevropsko) slovaropisno prakso, to pa je ravnanje, ki ni v skladu z razvojem znanosti. Znanost se namreč razvija z dograjevanjem že spoznanega. Izločanje je ena od značilnosti poslovnega in predvsem komercialnega sveta.

To je samo nekaj najbolj površinskih pomanjkljivosti predloga trojice, ki jih razberemo iz prikazanih fragmentov osmih neproblematičnih geselskih sestavkov in spremnega besedila. Resen slovarski koncept bi moral biti preizkušen na nekaj sto dokončno izdelanih slovarskih sestavkih z najrazličnejšo problematiko. Podpirati tako pomanjkljivo zastavljeni projekt lahko pomeni samo eno, namreč vero vanj. Znanstvenoraziskovalna misel pa ne verjame, je kritična in dvomi.

Razumljivo je, da državo v vlogi financerja zanima predvsem višina stroškov. Dobri štirje milijoni so za izdelavo temeljnega slovarja malo, zato je predlog trojice lahko mamljiv. Kot je bilo prikazano v prejšnjih odstavkih, bi bil po tem predlogu napisani slovar sicer uporaben za določene namene, vendar ne bi zadoščal merilom za uvrstitev med temeljne niti po obsegu, še manj pa po kakovosti in zanesljivosti vsebine. Slovenci rečemo, da se za malo denarja dobi malo muzike. Poceni naročene strehe na javnih zgradbah v Vipavski dolini odnaša burja, v Ljubljani in še kje začnejo zamakati in uničevati milijonsko računalniško opremo, po vseh predpisih naročeno vodovodno napeljavo na Onkološkem inštitutu bodo morali v celoti zamenjati itd., itd. Ko govorimo o temeljnem splošnem slovarju slovenskega jezika, pa ne govorimo o strehi, ne govorimo o računalnikih ali prepotrebni neoporečni vodi, govorimo o opisu jezika, ki določa nas in našo kulturno raven ter zaradi katerega smo, kar smo. Govorimo o temeljni vrednoti slovenskega naroda in o značilnosti, ki skupaj z ozemljem opredeljuje našo državo. Neustrezen premislek pri financiranju temeljnega slovarja nas zato lahko stane mnogo več. Pa s tem ne mislim »samo« na izgubo jezikovne in jezikoslovne tradicije, ki je noben kultiviran narod ne zanemarja, temveč tudi na to, da bo treba prej ali slej vendarle napisati sodoben temeljni slovar z zanesljivimi podatki. Slovar, ki ga brez 4,2-milijonskega obvoda lahko začnemo izdelovati že zdaj.

Ljudska modrost pravi: Ko ne veš, za kaj gre, gre za denar. Po pisanju Igorja Bratoža so »predlog podprli leksikografsko kompetentni strokovnjaki iz različnih institucij, od Filozofske fakultete do Instituta Jožef Stefan« (Delo, 9. 8. 2013, str. 4). Podporo predlogu je sopodpisalo 15 posameznikov in trije med njimi so res v službi na Filozofski fakulteti, dva pa na Institutu Jožef Stefan (kar seveda še ne pomeni, da ti dve instituciji predlog tudi podpirata), večina preostalih je v službi na Fakulteti za družbene vede ali v zasebnih podjetjih, vendar je med podpisniki le pet takih, ki imajo nekaj manjših slovaropisnih izkušenj, nihče pa doslej še ni sodeloval pri pisanju kakega temeljnega slovarskega dela. Po podatkih iz Cobissa je večina podpornikov predloga pisala članke o slovaropisni dejavnosti, trije so se podpisali med več kot petdeset soavtorjev Velikega angleško-slovenskega slovarja Oxford–DZS, ena podpisnica je vodila delo pri Turističnem terminološkem slovarju, glede katerega je Agencija za raziskovalno dejavnost izjemoma ustanovila komisijo za oceno zaključnega poročila projekta (komisija rektorja Univerze na Primorskem je namreč ugotovila vrsto vsebinskih pomanjkljivosti tega slovarja), še ena sopodpisnica pa je kot uslužbenka pri DZS sodelovala pri urejanju več dvojezičnih slovarjev. Zanimivo ob tem pa je, da domala vseh 15 podpisanih spada v interesni krog zasebnega zavoda Trojina, financiranega izključno z javnim denarjem, s katerim so povezani kot poslovni partnerji, zdajšnji ali nekdanji zaposleni, zdajšnji ali nekdanji honorarni sodelavci ali v smislu solastništva. Bolj kot o leksikografskih kompetencah sopodpisanih bi bilo torej smiselno govoriti o njihovih poslovnih interesih v obsegu (za začetek) 4,2 milijona evrov davkoplačevalskega denarja.

Pa vendar predlog trojice vsebuje nekaj dobrih zamisli, predvsem v uporabi nekaterih jezikovnotehnoloških orodij, slovaropisnih postopkov, prikazu kolokacij in sistemu zavihkov, ki bi jih veljalo vključiti v izdelavo novega temeljnega razlagalnega slovarja. Inštitut za slovenski jezik Frana Ramovša ZRC SAZU je v pogovorih že izrazil pripravljenost na sodelovanje s trojico, pri katerem bi vsaka od sodelujočih strani prevzela tista opravila, ki jih dokazljivo obvlada in za katera ima ustrezne reference. S takim sodelovanjem bi Slovenci lahko kmalu dobili nov, zanesljiv in vsestransko uporaben temeljni slovar sodobnega jezika brez izključevanja in brez nepotrebnih razprtij, ki jih Inštitut za slovenski jezik ne želi poglabljati. Predlog je še vedno na mizi.

Prof. dr. Marko Snoj je predstojnik Inštituta za slovenski jezik Frana Ramovša ZRC SAZU.