DOI: https://doi.org/10.11649/cs.2015.016

On Semantic Annotation in Clarin-PL Parallel Corpora

Violetta Koseska-Toszewa, Roman Roszko

Abstract


On Semantic Annotation in Clarin-PL Parallel Corpora

In the article, the authors present a proposal for semantic annotation in Clarin-PL parallel corpora: Polish-Bulgarian-Russian and Polish-Lithuanian ones. Semantic annotation of quantification is a novum in developing sentence level semantics in multilingual parallel corpora. This is why our semantic annotation is manual. The authors hope it will be interesting to IT specialists working on automatic processing of the given natural languages. Semantic annotation defined the way it is defined here will make contrastive studies of natural languages more efficient, which in turn will help verify the results of those studies, and will certainly improve human and machine translations.


Keywords


manual semantic annotation; semantic definiteness/indefiniteness category; logical quantification; uniqueness; existentiality; universality; elements of the semantic category of time; event; state; sequence of events and states finally ended with an event

Full Text:

PDF (in English)

References


Ajdukiewicz, K. (1974). Logika pragmatyczna. Warszawa: PWN.

Barwise, J. & Cooper, R. (1981). Generalized quantifiers and natural language. Linguistics and Philosophy, 4(2), 159–219. http://doi.org/10.1007/BF00350139

Barwise, J. & Perry, J. (1983). Situations and attitudes. Cambridge, Massachusetts: Bradford Books, MIT Press.

Bellert, I. (1971). On the use of linguistic quantifying operators. Poetics, 1(2), 71–86. http://doi.org/10.1016/0304-422X(71)90011-8

Bogusławski, A. (2003). Aspekt i negacja. Warszawa.

Cooper, R. (1996). The role of situations and generalized quantifiers. In S. Lappin (Ed.), The handbook of contemporary semantic theory. Oxford: Blackwell.

Desclés, J. P. (1999). Quantification, types, preuves et logique combinatoire. In Études cognitives | Studia Kognitywne (Vol. 3: Quantification, temps, Aspects | Kwantyfikacja, czas, aspekt, pp. 13–82).

Dimitrova, L. & Koseska, V. (2007). Digital dictionaries — problems and features. In Proceedings of the Jubilee International Conference Mathematical and Computational Linguistics (6 July 2007. Sofia, Bulgaria, pp. 25–34). Sofia.

Dimitrova, L. & Koseska, V. (2009a). Classifiers and digital dictionaries. Cognitive Studies | Études cognitives, 9, 117–131.

Dimitrova, L. & Koseska, V. (2009b). Bulgarian-Polish Corpus. Cognitive Studies | Études cognitives, 9, 133–141.

Dimitrova, L. & Koseska-Toszewa, V. (2008a). The significance of entry classifiers in digital dictionaries. In L. Iomdin & L. Dimitrova (Eds.), Lexicographic tools and techniques: Proceedings of MONDILEX First Open Workshop, 3–4 October 2008, Moscow (pp. 89–97).

Dimitrova, L. & Koseska-Toszewa, V. (2008b). Some problems in multilingual digital dictionaries. Cognitive Studies | Études cognitives, 8, 237–254.

Dimitrova, L. & Koseska-Toszewa, V. (2012). Bulgarian-Polish parallel digital corpus and quantification of time. Cognitive Studies | Études cognitives, 12, 199–207.

Dimitrova, L. & Koseska-Toszewa, V. (2014). Semantic properties of selected universal language categories in digital bilingual resources. Sofia.

Dimitrova, L., Koseska, V., & Roszko, R. (Eds.). (2009). Representing Semantics in Digital Lexicography. Innovative Solutions for Lexical Entry Content in Slavic Lexicography. MONDILEX Fourth Open Workshop. Warszawa, Poland, 29 June – 1 July, 2009. Proceedings (p. 145–158). Warsaw: Institute of Slavic Studies, Polish Academy of Sciences.

Dimitrova, L., Koseska, V., Garabík, R., Erjavec, T. Iomdin, L., & Shyrokov, V. (2010). Conceptual scheme for a research infrastructure supporting resources in Slavic lexicography. Sofia: Demetra Ltd. Publisher.

Dimitrova, L., Koseska, V., Garabík, R., Erjavec, T. Iomdin, L., & Shyrokov, V. (2011). Main results of MONDILEX project. Cognitive Studies | Études cognitives, 11, 265–290.

Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2009a). Bulgarian-Polish-Lithuanian Corpus — Problems of development and annotation. In T. Erjavec (Ed.), Research Infrastructure for Digital Lexicography. MONDILEX Fifth Open Workshop. Ljubljana, Slovenia, October 14–15, 2009, Proceedings of the 12th International Multiconference Information Society 2009 (pp. 72–86). Ljubljana: Department of Knowledge Technologies, Jožef Stefan Institute.

Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2009b). Bulgarian-Polish-Lithuanian Corpus — Current development. In C. Vertan, S. Piperidis, E. Paskaleva, & M. Slavcheva (Eds.), International Workshop: Multilingual Resources, Technologies and Evaluation for Central and Eastern European Languages held in conjunction with The International Conference RANLP-2009, Proceedings (pp. 1–8). Borovets.

Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2010). Application of multilingual corpus in contrastive studies (on the example of the Bulgarian-Polish-Lithuanian Parallel Corpus). Cognitive Studies | Études cognitives, 10, 217–239.

Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2011). Bulgarian-Polish-Lithuanian Corpus — Recent progress and application. In D. Majchráková & R. Garabík (Eds.), Natural language processing, multilinguality (pp. 30–43). Bratislava: Slovenská akadémia vied, Jazykovedný ústav Ludovíta Štúra.

Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2014). Trilingual Aligned Corpus — Current state and new applications. Cognitive Studies | Études cognitives, 14, 13–20. http://dx.doi.org/10.11649/cs.2014.002

Feleszko, K., Koseska-Toszewa, V., & Sawicka, I. (1974). Związki aspektu z temporalnością w językach południowosłowiańskich. Studia z Filologii Polskiej i Słowiańskiej, 14, 183–187.

Frege, G. (1892). Über Sinn und Bedeutung. Zeitschrift für Philosophie und philosophische Kritik, NF, 100, 25–50.

Garabík, R., Dimitrova, L., & Koseska-Toszewa, V. (2011). Web-presentation of Bilingual Corpora (Slovak-Bulgarian and Bulgarian-Polish). Cognitive Studies | Études cognitives, 11, 227–239.

Gołąb, Z., Heinz, A., & Polański, K. (1986). Słownik terminologii językoznawczej. Warszawa: PWN.

Grzegorczyk, R. (1972). Wykładniki kwantyfikacji w polskim zdaniu. In Prace na VII Międzynarodowy Kongres Slawistów w Warszawie 1973. Warszawa: PWN. (Z polskich studiów slawistycznych, Seria 4: Językoznawstwo).

Grzegorczyk, R. (1976). Aktualizacja wypowiedzi poprzez kwantyfikację argumentów i predykatu. Otàzky Slovanské syntaxe, 195–200.

Grzegorczykowa, R., Laskowski, R., & Wróbel, H. (Eds.). (1984). Morfologia. Warszawa: Państwowe Wydawnictwo Naukowe. (Gramatyka współczesnego języka polskiego: Składnia — Morfologia — Fonologia, 2)

Ivanchev, S. (1971). Problemi na aspektualnostta v slavianskite ezici. Sofiia: Izdatelstvo na BAN.

Karolak S. (1994). Le concept d’aspect et la structure notionnelle du verbe. In Études cognitives (Vol. 1: Semantique des categories d’aspect et de temps, pp. 21–42). Varsovie.

Karolak S. (2008). Gramatyka konfrontatywna bułgarsko-polska (V. Koseska-Toszewa, J. Penčev (Eds.) (Vol. 8: Semantyczna kategoria aspektu). Warszawa: SOW.

Koseska-Tosheva, V., & Gargov, G. (1990). Bŭlgarsko-polska sŭpostavitelna gramatika (Vol. 2: Semantichnata kategoriia opredelenost/neopredelenost). Sofiia.

Koseska-Toszewa, V. (1974) Z problematyki temporalno-aspektowej w języku bułgarskim. (Relacja imperfectum — aoryst). Studia z Filologii Polskiej i Słowiańskiej, 14, 213–226.

Koseska-Toszewa, V. (1982). Semantyczne aspekty kategorii określoności/nieokreśloności (na materiale z języka bułgarskiego, polskiego i rosyjskiego). Wrocław: Ossolineum.

Koseska-Toszewa, V. (1995). O aspekcie i czasie w ujęciu kognitywnym. Biuletyn Polskiego Towarzystwa Językoznawczego, 51, 25–31.

Koseska-Toszewa, V. (1997). Kvantifikatsiia i vid. In Semantika i struktura slavianskogo vida (Vol. 2, pp. 141–147). Kraków: Wydawnictwo Naukowe Wyższej Szkoły Pedagogicznej.

Koseska-Toszewa, V. (2006). Gramatyka konfrontatywna bułgarsko-polska (V. Koseska-Toszewa & J. Penčev, Eds.) (Vol. 7: Semantyczna kategoria czasu). Warszawa: Slawistyczny Ośrodek Wydawniczy.

Koseska-Toszewa, V. & Mazurkiewicz, A. (1988). Net representation of sentences in natural languages. In G. Rozenberg (Ed.), Advances in Petri Nets 1988 (pp. 249–265). Berlin, Heidelberg: Springer Berlin Heidelberg.

Koseska-Toszewa, V. & Mazurkiewicz, A. (1991) Sieciowe przedstawienie temporalności i modalności w zdaniach języka naturalnego In Studia gramatyczne bułgarsko-polskie (Vol. 4: Modalność a inne kategorie językowe, pp. 7–25). Wrocław.

Koseska-Toszewa, V. & Mazurkiewicz, A. (1994). Description a l’aide de réseaux de la temporalité et modalite dans la phrases dans la langue naturelle. In Études cognitives | Studia Kognitywne (Vol. 1, pp. 89–112).

Koseska-Toszewa, V. & Mazurkiewicz, A. (2004). Once more about net representation of the semantic category of tense. Études cognitives | Studia Kognitywne, 6, 63–81.

Koseska-Toszewa, V. & Mazurkiewicz, A. (2010). Time flow and tenses. Warszawa: SOW.

Laskowski, R. (1986). System temporalno-aspektowo-modalny języka polskiego a sieci Petriego (Uwagi do artykułu A. Mazurkiewicza). In Studia gramatyczne bułgarsko-polskie (Vol. 1: Temporalność, pp. 23–30). Wrocław: Zakład Narodowy im. Ossolińskich.

Mazurkiewicz, A. (1986). Zdarzenia i stany: elementy temporalności. In Studia gramatyczne bułgarsko-polskie (Vol. 1: Temporalność, pp. 7–21). Wrocław: Zakład Narodowy im. Ossolińskich.

Montague, R. M. (1974). Formal philosophy: Selected papers of Richard Montague (R. H. Thomason, Ed. & Introd.). New Haven: Yale Univ. Press.

Petri, C. A. (1963). Fundamentals of the theory of asynchronous information Flow. In Proc. of IFIP'62 Congress (pp. 386–391). Amsterdam: North Holland Publ. Comp.

Pogorzelski, W. A. (1989). Elementarny słownik logiki formalnej. Białystok: Rozprawy Uniwersytetu Warszawskiego.

Rasiowa, H. (1975). Wstęp do matematyki współczesnej (pp. 211–255). Warszawa: Wydawnictwo Naukowe PWN.

Reichenbach, H. (1967). Analiza języka potocznego. In J. Pelc (Ed.) Logika i język. Warszawa: Państwowe Wydawnictwo Naukowe.

Roszko, D. (2015). Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej (na tle literackich języków polskiego i litewskiego). Warszawa.

Roszko, D. & Roszko, R. (2014). A net presentation of Lithuanian sentences containing verbal forms with the grammatical suffix -dav-. Cognitive Studies | Études cognitives, 14, 173–182. http://doi.org/10.11649/cs.2014.014

Roszko, R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim). Warszawa: Slawistyczny Ośrodek Wydawniczy.

Russell, B. (1967). Denotowanie. Deskrypcje. In J. Pelc (Ed.) Logika i język (pp. 377–413). Warszawa: Państwowe Wydawnictwo Naukowe.

Topolińska, Z. (Ed.). (1984). Składnia. Warszawa: Państwowe Wydawnictwo Naukowe. (Gramatyka współczesnego języka polskiego: Składnia — Morfologia — Fonologia, 1)

Zaimov, Ĭ. (1982). Suprasŭlski ili Retkov sbornik v dva toma: Uvod i komentar na starobŭlgarskiia tekst. Sofiia: Bŭlgarska akademiia na naukite.
Copyright (c) 2015 Violetta Koseska-Toszewa, Roman Roszko

License URL: http://creativecommons.org/licenses/by/3.0/pl/