DOI: https://doi.org/10.11649/abs.2016.018

The Electronic Historical Latvian Dictionary Based on the Corpus of Early Written Latvian Texts

Everita Andronova, Renāte Siliņa-Piņķe, Anta Trumpa, Pēteris Vanags

Abstract


The Electronic Historical Latvian Dictionary Based on the Corpus of Early Written Latvian Texts

This article deals with the development of the Electronic Historical Latvian Diction­ary (http://www.tezaurs.lv/lvvv) based on the Corpus of Early Written Latvian Texts (http://www.korpuss.lv/senie/). Some issues concerning the compilation and processing of the corpus data are discussed and the main sources added to the Corpus during the four-year project are described: the 16th c. Lord’s Prayers, 17th c. dictionaries, texts of oaths and laws, religious texts and so-called dedication poetry. The aim of the project is to compile a pilot electronic dictionary of 16th–17th century Latvian where all parts of speech are represented among the entries. This dictionary will contain ca. 1,200 entries, including both proper names and common nouns.

The main emphasis is on the description of the dictionary entries supplied with relevant practical and theoretical observations. Each part of the dictionary entry is discussed, followed by comments on various issues pertaining to that part (e.g., the choice of headword and the representation of spelling versions) and how these were resolved. Special attention is paid to the head of entry, explanation of meaning deduced from the examples found in the corpus, different types of collocations and their representation in the dictionary, as well as etymological information. Finally, we present a brief review of the dictionary writing software TLex 2013 based on our experience with this tool.

 

Elektroniczny historyczny słownik łotewski oparty na korpusie wczesnych tekstów łotewskich

Artykuł poświęcony jest powstawaniu Elektronicznego historycznego słownika łotewskiego (http://www.tezaurs.lv/lvvv) w oparciu o korpus wczesnych tekstów łotewskich (http://www.korpuss.lv/senie/). Omówiono niektóre kwestie odnoszące się do opraco­wania i przetwarzania danych korpusowych. Ponadto opisano główne źródła dodane do korpusu w okresie czteroletniej pracy nad nim: Modlitewnik z XVI w., słowniki, teksty ślubowań i statutów, teksty religijne i tzw. poezja dedykowana z XVII w. Celem projektu jest opracowanie pilotażowego elektronicznego słownika szesnasto- i siedemnastowiecznego języka łotewskiego, w którym hasła obejmą wszystkie części mowy. Słownik będzie zawierał około 1200 haseł, w tym nazwy własne i rzeczowniki pospolite.

Główny nacisk położono na opis haseł słownikowych, zawierający istotne uwagi praktyczne i teoretyczne. Omówiono poszczególne części hasła słownikowego, po czym umieszczono komentarz odnoszący się do różnych kwestii związanych z daną częścią (np. wybór hasła wyrazowego i przedstawienia wersji pisowni) i do przyję­tych rozwiązań. Szczególną uwagę poświęcono główce hasła, objaśnieniu znaczenia wynikającego z przykładów występujacych w korpusie, różnym rodzajom kolokacji i ich przedstawieniu w słowniku, jak też informacjom etymologicznym. Na końcu zamieszczono zwięzły przegląd oprogramowania słownikowego TLex 2013, oparty na doświadczeniu autorów, zdobytym podczas pracy z tym narzędziem.


Keywords


Corpus-based historical dictionary of Latvian; the Corpus or Early Latvian Texts; dictionary entry; collocations and idioms; explanation of origin; cross-references in dictionaries; dictionary writing software; TLex Suit 2013

Full Text:

PDF (in English)

References


Andronova, E. (2007). The Corpus of Early Written Latvian: Current state and future tasks. In Proceedings of ‘Corpus Linguistics 2007’. Birmingham, UK. Retrieved 20 July 2016, from http:ucrel.lancs.ac.uk/publications/CL2007/paper/245_Paper.pdf

Andronova, E., Siliņa-Piņķe, R., Trumpa, A., & Vanags, P. (2008). Latviešu valodas vēsturiskās vārdnīcas (16.–18. gs.) projekts: pirmā posma rezultāti un turpmākie uzdevumi. In Letonikas otrais kongress: Valodniecības raksti-1 (pp. 74–89). Rīga: LU Latviešu valodas institūts.

Andronova, E., Trumpa, A., & Vanags, P. (2006). Latviešu valodas vēsturiskās vārdnīcas (16.–18. gs.) projekts: iestrādes un problēmas. In Letonikas pirmais kongress: Valodniecības raksti (pp. 9–17). Rīga: Latvijas Zinātņu akadēmija.

Andronova, E., Trumpa, A., & Vanags, P. (2012). Latviešu valodas vēsturiskās vārdnīcas (16.–17. gs.) projekts: Problēmas un risinājumi. In Apvienotais Pasaules latviešu zinātnieku III kongress un Letonikas IV kongress „Zinātne, sabiedrība un nacionālā identitāte”: Valodniecības raksti (pp. 196–209). Rīga: LU Latviešu valodas institūts.

Augstkalns, A. (2009). Darbu izlase. Rīga: LU Latviešu valodas institūts.

Ādamsons, E., & Kagaine, E. (2000). Vainižu izloksnes vārdnīca (Vols. A–M, N–Ž). Rīga: LU Latviešu valodas institūts.

Betz, W. (1959). Lehnwörter und Lehnprägungen im Vor-und Frühdeutschen. In F. Maurer & F. Stroh (Eds.), Deutsche Wortgeschichte (neubearb. Aufl., Vol. 1, pp. 127–147). Berlin: de Gruyter.

Biezais, H. (1973). Geistliche Lieder von Salomon Gubertus. In Beiträge zur lettischen Kultur-und Sprachegeschichte (pp. 69–78). Åbo: Åbo Akademi.

Bībele. (2012). Rīga: Latvijas Bībeles biedrība.

Breidaks, A. (1994). H. Megisers un veclatviešu rakstu valodas sākotne. In Baltu filoloģija IV. Zinātniski informatīvi ziņojumi (pp. 15–18). Rīga: Latvijas Universitāte.

Bruno tēvreize [Br1520_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/static/ Br1520_PN.html

Catechismvs Catholicorum… [CC1585]. (1585). Ehsprestcz Vilne Pille Littoutte Semmen pi Danielem Lanciciensem expan tho gadde 1585.

Das Haus=, Zucht= vnd Lehrbuch Jesu Syrachs [Manc1631_Syr]. (1931). Riga: Gerhard Schröder.

Das Hauß=Zucht=und Lehr=Buch Jesus Syrachs… [VLH1685_Syr]. (1685). Mitau: George Radetzky.

Die Sprüche Salomonis… [Manc1637_Sal]. (1637). Riga: Gerhard Schröder.

Die Sprüche Salomonis… [VHL 1685_Sal]. (1685). Mitau: George Radetzky.

Dressell, G. (1682). Swähta Bährno=Mahziba… [Dres1682_SBM]. Riga: Heinrich Bessemesser.

Dunsdorfs, E. (1962). Latvijas vēsture 1600.–1710. Stokholma: Daugava.

Elektroniczny słownik języka polskiego XVII i XVIII wieku [SXVII]. (n.d.). Retrieved 20 July 2016, from http://sxvii.pl/

Elger, G. (1621). Geistliche Catholische Gesänge… [Elg1621_GCG]. Braunßberg: George Schönfels.

Ernštreits, V., Muzikante, M., & Grīnberga, M. (2015). Igauņu-latviešu vārdnīca [ILV]. Rīga: Latviešu valodas aģentūra.

Ēdelmane, I., & Ozola, Ā. (2003). Latviešu valodas augu nosaukumi. Rīga: SIA „Augsburgas institūts”.

Fohrmann, H. (1690). Laimiga Lauliba… [Fuhr1690_LL]. Riga: Georg. Matth. Nöller.

Fraenkel, E. (1962–1965). Litauisches etymologisches Wörterbuch (Vols. 1–2). Heidelberg: Carl Winter.

Fürecker, C. (1650–1670). Lettisches und Teutsches Wörterbuch… (The first manuscript) [Fuer1650_70_1ms]. Retrieved 20 July 2016, from http://korpuss.lv/senie/source. jsp?codificator=Fuer1650_70_1ms

Fürecker, C. (1650–1670). Lettisches und Teutsches Wörterbuch… (The second manuscript) [Fuer1650_70_2ms]. Retrieved 20 July 2016, from http://korpuss.lv/senie/source. jsp?codificator=Fuer1650_70_2ms

Gisberta tēvreize [Gis1507_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/ static/Gis1507_PN.html

Grūnava tēvreize [Gr1520_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/ static/Gr1520_PN.html

Gubertus, S. (1645). Stratagema Oeconomicum Oder Ackerstudent Denen jungen Vngeübten Ackerleuten in Lieffland zum nöhtigen Vnterricht… Riga: Gerhard Schröder.

Hazentētera tēvreize [Has1550_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/ senie/static/Has1550_PN.html

Hock, W. et al. (2015). Altlitauisches etymologisches Wörterbuch [ALEW] (Vols. 1–3). Hamburg: Baar-Verlag. (Studien zur historisch-vergleichenden Sprachwissenschaft, 7).

Joffe, D., de Schryver, G.-M., & Prinsloo, D. J. (2003). Introducing TshwaneLex – A New Computer Program for the Compilation of Dictionaries. In G.-M. de Schryver (Ed.), TAMA 2003 South Africa: Conference Proceedings (pp. 97–104). Pretoria: (SF)2 Press. Retrieved 20 July 2016, from http://tshwanedje.com/publications/tama-TL.pdf

Jordan, S. (1995). Niederdeutsches im Lettischen. Untersuchungen zu den mittelniederdeutschen Lehnwörtern im Lettischen. Bielefeld: Verlag für Regionalgeschichte.

Kagaine, E., & Raģe, S. (1977–1983). Ērģemes izloksnes vārdnīca (Vols. 1–3). Rīga: Zinātne.

Kaņepāju kulstītāju amata zvērests [Zv1689_Kan]. (n.d.). LVVA funds 1382, inventory 2, files 11, pp. 251–253.

Karulis, K. (1992). Latviešu etimoloģijas vārdnīca (Vols. 1–2). Rīga: Avots.

Kļava, K. (1989). Die Sprache der lettischen juristischen Dokumente vom Ende des 17. Jahrhunderts: Ein Beitrag zur lettischen Sprachgeschichte. Stockholm: Almqvist & Wiksell International.

Lasch, A., & Borchling, C. et al. (1928). Mittelniederdeutsches Handwörterbuch [LB]. (Vol. 1). Neumünster: Wachholtz.

Latviešu valodas izlokšņu vārdnīca. Prospekts [LVIV]. (2005). Rīga: LU Latviešu valodas institūts.

Lācija tēvreize [Laz1557_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/static/ Laz1557_PN.html

Lettische geistliche Lieder und Kollekten… [LGL1685_K1]. (1685). Mitau: George Radetzky.

Lettische geistliche Lieder und Psalmen… [LGL1685_V5]. (1685). Riga: Georg Matth. Nöller.

Liecinieku zvērests 1 [Zv1681_Liec_1]. (n.d.). LVVA funds 1379, inventory 1, files 27, p. 1.

Liecinieku zvērests 2 [Zv1681_Liec_2]. (n.d.). LVVA funds 1382, inventory 2, files 7, p. 1b.

Lietuvių kalbos žodynas [LKŽ]. (1941–2002) (Vols. 1–20). Vilnius: Mintis, Mokslas, Lietuviu kalbos instituto leidykla.

Liģeru amata zvērests [Zv1698_Lig]. (n.d.). LVVA funds 1382, inventory 2, files 11, pp. 261–263.

Linaudēju šrāga [LS1625]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/static/ LS1625.html

Luther, M. (1685). Der kleine Catechismus… durch den Seel: Hrn: Georgium Mancelium… In Lettischer Sprache außgegeben… [VLH1685_Cat]. Mitau: George Radetzky.

Luther’s Biblia 1545 Original-Text. Ausgabe letzter Hand [Luth1545]. (n.d.). Retrieved 20 July 2016, from http://lutherbibel.net/

M.W. (1696). In Dissertatio Philosophica: De Trinitate Platonis et platonicorum Quam Adspirante divinâ gratia et Consentiente Amplissimó Philosopho rum Ordine in almâ ad Emmam Academiâ Gustaviano-Carolina, Sub Praesidio viri celeberrimi Michaelis Dau, Elog. et Poës.Prof.Ordin.u.h.t. Facultatis Philosophicae Decano, Publicè ventilandam proponit Heinrich Christian Wagener Saxo [Witt1696_MMID]. Dorpati: Excudit Johannes Bre¬deken, Acad.Typogr.

Mancelius, G. (1631). Lettisch Vade mecum [Manc1631_LVM]. Riga: Gerhard Schröder.

Mancelius, G. (1638). Lettus… [Manc1638_L]. Riga: Gerhard Schröder.

Mancelius, G. (1638). Phraseologia Lettica… [Manc1638_PhL]. Riga: Gerhard Schröder.

Mancelius, G. (1638). Zehen Gespräche Deutsch und Lettisch… – Phraseologia Lettica… [Manc1638_Run]. Riga: Gerhard Schröder.

Mancelius, G. (1654). Lang=gewünschte Lettische Postill… [Manc1654_LP1] (Vol. 1). Riga: Gerhard Schröder.

Mancelius, G. (1654). Lang=gewünschte Lettische Postill… [Manc1654_LP2] (Vol. 2). Riga: Gerhard Schröder.

Megisera tēvreize [Meg1593_PN]. (n.d.). Retrieved 20 July 2016, from http://korpuss.lv/senie/ static/Meg1593_PN.html

Metsmägi, I., Sedrik, M., & Soosaar, S.-E. (2012). Eesti etümoloogiasõnaraamat [ETS]. Tallinn: Eesti Keele Sihtastus.

Milčonoka, E. (2003). Latviešu valodas 17. gadsimta teksti internetā. Baltu filoloģija, 12(1), 139–150.

Mīlenbahs, K. (1923–1932). Latviešu valodas vārdnīca [ME] (Vols. 1–4). (J. Endzelīns, Ed.). Rīga: Kultūras fonds.

Mīlenbahs, K. (1932). Latviešu valodas vārdnīca [ME IV] (Vol. 4). (J. Endzelīns, Ed.). Rīga: Kultūras fonds.

Muhso Augsta un Warrena Kehnina Sohdu=Likkums prett to Behrno=Muschinaschanu [SL1684]. (1684). Riga: Georg Matth. Nöller.

Nevācu koku šķirotāju zvērests [Zv1681_Kok]. (n.d.). LVVA funds 1382, inventory 2, files 7, p. 1a.

Paikens, P., Auzina, I., Garkaje, G., & Paegle, M. (2012). Towards named entity annotation of Latvian National Library corpus. In Human language technologies – the Baltic perspective (pp. 169–175). (Frontiers in Artificial Intelligence and Applications, 247). http://doi. org/10.3233/978-1-61499-133-5-169

Pokorny, J. (1959–1969). Indogermanisches etymologisches Wörterbuch (Vols. 1–2). Bern: Francke.

Pokrotniece, K. (2012). Grēki un parādi – pamest vai piedot? (Ieskats latviešu senajās tēvreizēs). Baltistica, (8 priedas), 111–122. http://dx.doi.org/10.15388/baltistica.0.8.2115

Pretkalniņa, L., Paikens, P., Grūzītis, N., Rituma, L., & Spektors, A. (2012). Making historical Latvian texts more intelligible to contemporary readers. In Proceedings of LREC 2012 Workshop “Adaptation of Language Resources and Tools for Processing Cultural Heritage Objects”, Istanbul, Turkey, 2012 (pp. 29–35). Retrieved 20 July 2016, from http://www. lrec-conf.org/proceedings/lrec2012/workshops/13.ProceedingsCultHeritage.pdf

Range, J. D. (1994). Zur Erforschung des Lehngutes in den Baltischen Sprachen. Linguistica Baltica, 3, 211–231.

Reichmann, O. (2012). Historische Lexikographie. Berlin: De Gruyter.

Reķēna, A. (1998). Kalupes izloksnes vārdnīca (Vols. 1–2). Rīga: Latviešu valodas institūts.

Ross, K., & Vanags, P. (Eds.). (2008). Common roots of the Latvian and Estonian literary languages. Frankfurt am Main: Peter Lang.

Rūķe-Draviņa, V. (1977). The standardization process in Latvian 16th century to the present. Stockholm: Almquist & Wiksell. (Acta Universitatis Stockholmiensis. Stockholm Slavic Studies, 11)

Sawadi Karra=Teesas Likkumi [SKL1696_KB]. (1696). Rigâ.

Sawadi Karra=Teesas Likkumi [SKL1696_RA]. (1696). Rigâ.

Sālsnesēju amata zvērests [Zv1689_Salsnes]. (n.d.). LVVA funds 1382, inventory 2, files 11, pp. 249–250.

Schiller, K., & Lübben, A. (1875–1881). Mittelniederdeutsches Wörterbuch [SL] (Vols. 1–6). Bremen: J. Kühtmann’s Buchhandlung.

Sehwers, J. (1918). Die deutschen Lehnwörter im lettischen (Inaugural-Dissertation zur Erlangung der Doktorwürde der hohen philosophischen Fakultät I der Universität Zürich). Zürich: Buchdruckerei Berichthaus.

Sehwers, J. (1953). Sprachlich-kulturhistorische Untersuchungen vornehmlich über den deutschen Einfluss im Lettischen. Berlin: Harrassowitz.

Semmiga Paklannischana… [Unknown author’s dedication poem] [ZP1685]. (1685). Drukketa no Jurra Radezka zeeniga Leela Kunga Grahmatu=Drukkera.

Shorter Oxford English Dictionary [SOED]. (1993) (1st ed., Vol. 1). New York: Oxford University Press.

Siliņa-Piņķe, R., & Trumpa, A. (2014). Das Historische Wörterbuch der Lettischen Sprache (16.–18. Jahrhundert): Vorstellung und eine Fallstudie. In B. Bock & M. Kozianka (Eds.), Weiland Wörter-Welten – Akten der 6. Internationalen Konferenz zur Historischen Lexikographie und Lexikologie (Jena, 25.–27. Juli 2012.) [Whilom Worlds of Words – Pro-ceedings of the 6th International Conference on Historical Lexicography and Lexicology (Jena, 25–27 July 2012)] (pp. 261–272). Hamburg: Verlag Gr. Kovač.

Slovar’ drevnerusskogo iazyka (XI–XIV vv.) [SDIA XI–XIV]. (1988–2013) (Vols. 1–10). Moskva: Rus. iaz., Azbukovnik.

Slovar’ obikhodnogo russkogo iazyka Moskovskoĭ Rusi XVI–XVII vekov [SORIAMR XVI–XVII]. (2004). Sankt-Peterburg: Nauka.

Slovar’ russkogo iazyka XI–XVII vv. [SRIA XI–XVII]. (1975–). Moskva: Nauka.

Smoczyński, W. (2007). Słownik etymologiczny języka litewskiego. Wilno: Universitas.

Summent, A. (1950). Unbeachtete slawische Lehnwörter im Lettischen (Inaugural-Dissertation zur Erlangung der Doktorwürde). Göttingen: Georg-August-Universität.

Svensén, B. (2009). A handbook of lexicography: The theory and practice of dictionary-making. Cambridge: Cambridge University Press.

Tas Jauns Testaments… [JT1685]. (1685). Riga: Johann Georg Wilcken Königl. Buchdr.

Urbańczyk, S. (Ed.). (1953–2002). Słownik staropolski [SSP] (Vols. 1–76). Wrocław, Warszawa, Kraków, Gdańsk.

Vanags, P. (2009). Die Literatur der Letten im Zeichen von Reformation und Konfessionalisierung. In M. Asche, W. Buchholz, & A. Schindling (Eds.), Die baltische Lande im Zeitalter der Reformation und Konfessionalisierung (Pt. 1, pp. 263–305). Münster: Aschendorf.

Vanags, P. (2014). Latviešu valodas vēsturiskās vārdnīcas projekts. In Valodas prakse: Vērojumi un ieteikumi (pp. 97–109). Rīga: Latviešu valodas aģentūra.

Vermehretes Lettisches Hand=Buch… [VLH1685]. (1685). Mitau: George Radetzky.

Viitso, T.-R., & Ernštreits, V. (2012–2013). Līvõkīel-ēstikīel-lețkīel sõnārōntõz [LETLS]. Rīga: Latviešu valodas aģentūra.

Wörterbuchnetz [WBN]. (n.d.). Retrieved 20 July 2016, from http://woerterbuchnetz.de/

Ziņu sniedzēja zvērests Vidzemes arklu revīzijā [Zv1638_VAR]. (n.d.). Retrieved 20 July 2016, from http://www.korpuss.lv/senie/static/Zv1638_VAR.html
Copyright (c) 2016 Everita Andronova, Renāte Siliņa-Piņķe, Anta Trumpa, Pēteris Vanags

License URL: http://creativecommons.org/licenses/by/3.0/pl/