PDF Print E-mail
There are no translations available.

Ikka juhtub nii, et koostaja alustab sõnaraamatu tegemist tekstieditoriga ja alles paar aastat hiljem selgub, et fail kasvab üle pea -- töö on aeglane, artiklid ebajärjekindlalt vormistatud ja pidevalt tuleb üles-alla kerida, et järele vaadata, kas või kuidas midagi eelnevalt kirja pandud sai. Kord-või paar aastas tuleb selline algmaterjal teisendada EELexile söödavaks XMLiks. Word -> HTML on lihtne, HTMLi puhastamine mitte enam nii lihtne, saadud enam-vähem ainult i, b ja sup siltidega lameda lõigu struktureerimine aga paras pähkel. Selle asemel, et seda iga kord poolkäsitsi teha, oleks hea, kui selleks oleks sõnastike eripäradest sõltumatu tööriist. Sisendiks struktuur, millele tulemus peab vastama, reeglistik ja lame artikkel, väljundiks artikli valideeruv XML kuju.

aed1 1. tarastatud ala maja ümber; 2. kasvandus

peaks laias laastus andma midagi sellist:

‹märksõna @homonüüminumber=1›aed‹/märksõna›‹tähenduste grupp›‹tähendus @tähendusnumber=1›tarastatud ala maja ümber‹/tähendus›‹tähendus @tähendusnumber=2›kasvandus‹/tähendus›‹/tähenduste grupp›

Reeglid võivad sisaldada regulaaravaldisi või kontekstitingimusi, peaasi, et struktuuripuu ehitamine toimuks mõistliku kiirusega (aga kuna tegevus on ühekordne, siis üks märksõnaartikkel minutis piisab). Arvestada tuleb kõikvõimalike veidrustega, mis tekstieditoriga kaasa tulevad: poolpaksud reavahetused, ebajärjekindel vormistus (nt ülaindeks kord märgendina, kord teksti stiiliga, kord jõuga fondi suurus ja positsioon).

Näide päriselust ("likats" murdesõnaraamatus):

‹w:rStyle w:val="ms1"/›	‹w:t›likats‹/w:t›
	‹w:t› ‹/w:t›
‹w:i/›	‹w:t›lika|ts ‹/w:t›
	‹w:t›Krl, g ‹/w:t›
‹w:i/›	‹w:t›-tsi‹/w:t›
	‹w:t› Kod Vas, ‹/w:t›
‹w:i/›	‹w:t›-dsi ‹/w:t›
	‹w:t›Rõu; ‹/w:t›
‹w:i/›	‹w:t›likat́s ‹/w:t›
	‹w:t›Kod Kan Krl Har Rõu Vas, ‹/w:t›
‹w:i/›	‹w:t›-t́si ‹/w:t›
	‹w:t›Urv, ‹/w:t›
‹w:i/›	‹w:t›-dsi ‹/w:t›
	‹w:t›Urv Se (esemete osa) ‹/w:t›
‹w:b/›	‹w:t›a. ‹/w:t›
	‹w:t›voki keps, vänt ‹/w:t›
‹w:i/›	‹w:t›Ku voḱki sõkut‹/w:t›
	‹w:t›,‹/w:t›
‹w:i/›	‹w:t› sõ̭ss likat́s liiguss ja vedä ratast `ümbreʔ‹/w:t›
	‹w:t›; ‹/w:t›
‹w:i/›	‹w:t›Kae˽mul taad voḱi likat́sit‹/w:t›
	‹w:t›, ‹/w:t›
‹w:i/›	‹w:t›taal om vaest midägi vika‹/w:t›
	‹w:t›, ‹/w:t›
‹w:i/›	‹w:t›mitte ei˽püüsü˽vändä küllen‹/w:t›
	‹w:t› Urv; ‹/w:t›
‹w:i/›	‹w:t›likadsiga `aeti ‹/w:t›
	‹w:t›[voki]‹/w:t›
‹w:i/›	‹w:t› `tsõõri `ümbre‹/w:t›
	‹w:t› Rõu ‹/w:t›
‹w:b/›	‹w:t›b. ‹/w:t›
	‹w:t›kella pendel – Krl Vas Se ‹/w:t›
‹w:b/›	‹w:t›c. ‹/w:t›
	‹w:t›puupulk veskikolu kinga all, mis teri kivide vahele raputab – Kod ‹/w:t›
‹w:b/›	‹w:t›d. ‹/w:t›
	‹w:t›raud ukselingi all lingi tõstmiseks – Har ‹/w:t›
‹w:b/›	‹w:t›Vrd‹/w:t›
	‹w:t› likutis, likuts, lipats‹/w:t›

Enamus gruppe või elemente võib korduda, aga ühe tähenduse sees on struktuur üldjoontes:

<x:tp x:tnr="1">
<x:tg>
    <x:dg>
    <x:d>definitsioon
<x:np> <x:ng> <x:n>`näite`fraas
<x:khk>murdeala lühend
<x:tvtg> <x:tvt x:i="1" x:tvtl="syn">vaata_ka_sünonüümne_märksõna