DOI: https://doi.org/10.11649/cs.1718

Dynamic verbs in the Wordnet of Polish

Agnieszka Dziob, Maciej Piasecki

Abstract


Dynamic verbs in the Wordnet of Polish

The paper presents patterns of co-occurrences of wordnet relations involving verb lexical units in plWordNet - a large wordnet of Polish. The discovered patterns reveal tendencies of selected synset and lexical relations to form regular circular structures of clear semantic meanings. They involve several types of relations, e.g., presupposition, cause, processuality and antonymy, do not have a necessary character (there are exceptions), but can be used in wordnet diagnostics and guidelines for wordnet editors. The analysis is illustrated with numerous positive and negative examples, as well as statistics for verb relations in plWordNet 4.0 emo. Some attempts to a more general, linguistic explanation of the observed phenomena are also made. As a background, plWordNet model of linguistic character is briefly recollected. A special attention is given to the verb part. In addition the description of dynamic verbs by relations and features is discussed in details including relation definitions and substitution tests.

 

Czasowniki dynamiczne w Słowosieci - wordnecie języka polskiego

W artykule zostały przedstawione wzorce współwystępowania relacji leksykalno-semantycznych obejmujących czasownikowe jednostki leksykalne w ramach Słowosieci - wielkiego relacyjnego słownika języka polskiego, wordnetu języka polskiego. Tłem obserwacji jest Słowosieć 4.0 emo, dla której omówiono skrótowo system relacji czasownikowych wraz ze statystykami. Szczególną uwagę autorzy poświęcili czasownikom dynamicznym i ich typowym relacjom, dla których przedstawiono testy substytucji z wytycznych do relacyjnego opisu czasownika, zdefiniowanych na potrzeby edycji Słowosieci przez lingwistów. Opisane w artykule wzorce współwystępowania ukazują tendencje niektórych relacji synsetów (tj. zbiorów synonimów) i jednostek leksykalnych (m.in. presupozycji, kauzacji, procesywności i antonimii) do tworzenia regularnych struktur, specyfikujących znaczenie wszystkich jednostek/synsetów, połączonych za pomocą danych relacji. Współwystępowania relacji wg wzorców nie mają charakteru obligatoryjnego, dlatego też w artykule przedstawiono zarówno pozytywne, jak i negatywne przykłady jednostek i synsetów, połączonych ze sobą za pomocą relacji współwystępujących, jak i pewne uwagi natury ogólnej, wskazujące na językowy charakter obserwowanego zjawiska. Oprócz znaczenia poznawczego, związanego ze współzależnościami, jakie zachodzą w obrębie systemu językowego, opis tych regularności ma również znaczenie praktyczne - może być wykorzystany przy diagnostyce wordnetu oraz w wytycznych dla lingwistów.


Keywords


plWordNet; Wordnet of Polish; lexico-semantic relations; Polish language; dynamic verbs; verbs in wordnet; natural language processing

Full Text:

PDF (in English)

References


Brown, C. H. (2004). Paradigmatic relations of inclusion and identity II: Meronymy. In D. A. Cruse, F. Hundsnurscher, & P. R. Lutzeier (Eds.), Lexicology: An international handbook on the nature and structure of words and vocabularies (Vol. 1, pp. 480-485). Berlin: Walter de Gruyter.

Dimitrova, T., Tarpomanova, E., & Rizov, B. (2014). Coping with derivation in the Bulgarian WordNet. In Proceedings of the Seventh Global WordNet Conference (pp. 109-117). Tartu: University of Tartu Press.

Dziob, A., & Piasecki, M. (2018). Implementation of the verb model in plWordNet 4.0. In F. Bond, C. Fellbaum, & P. Vossen (Eds.), Proceedings of the 9th Global Wordnet Conference, Singapore, 8-12 January 2018. Global Wordnet Association.

Dziob, A., Piasecki, M., Maziarz, M., Wieczorek, J., & Dobrowolska-Pigoń, M. (2017). Towards revised system of verb wordnet relations for Polish. In J. P. McCrae, F. Bond, P. Buitelaar, P. Cimiano, T. Declerck, J. Gracia, I. Kernerman, E. Montiel Ponsoda, N. Ordan, & M. Piasecki (Eds.), Proceedings of the LDK 2017 Workshops: 1st Workshop on the OntoLex Model (OntoLex-2017), Shared Task on Translation Inference Across Dictionaries & Challenges for Wordnets co-located with 1st Conference on Language, Data and Knowledge (LDK 2017) (pp. 174-187). Retrieved August 31, 2017, from http://ceur-ws.org/Vol-1899/

Fellbaum, C. (Ed.). (1998). WordNet: An electronic lexical database. Cambridge, MA: MIT Press.

Haspelmath, M. (1993). More on the typology of inchoative/causative verb alternations. In B. Comrie & M. Polinsky (Eds.), Causatives and transitivity (pp. 87-121). Amsterdam: John Benjamins Publishing Company. (Studies in Language Companion Series, 23). https://doi.org/10.1075/slcs.23.05has

Horvath, J., & Siloni, T. (2011). Anticausatives: Against reflexivization. Lingua, 121(15), 2176-2186. https://doi.org/10.1016/j.lingua.2011.09.006

Koeva, S. (2008). Derivational and morphosemantic relations in Bulgarian Wordnet. In M. A. Kłopotek (Ed.), Intelligent information systems XVI: Proceedings of the International IIS '08 Conference, held in Zakopane, Poland, June 16-18, 2008 (pp. 359-368). Warszawa: Institute of Computer Science, Polish Academy of Sciences.

Koeva, S. (2010). Bulgarian wordnet - current state, applications and prospects. In M. Drinov (Ed.), Bulgarian-American dialogues (pp. 120-132). Sofia: Academic Publishing House.

Koontz-Garboden, A. (2009). Anticausativization. Natural Language & Linguistic Theory, 27(1), 77-138. https://doi.org/10.1007/s11049-008-9058-9

Laskowski, R. (1998). Kategorie morfologiczne języka polskiego - charakterystyka funkcjonalna. In R. Grzegorczykowa, R. Laskowski, & H. Wróbel (Eds.), Gramatyka współczesnego języka polskiego: Morfologia (2nd ed., Vol. 1). Warszawa: PWN.

Levin, B., & Hovav, M. R. (1995). Unaccusativity: At the syntax-lexical semantics interface. Cambridge, MA: MIT Press. (Linguistic Inquiry Monographs, 26).

Lis, M., & Navarretta, C. (2014). Classifying the form of iconic hand gestures from the linguistic categorization of co-occurring verbs. In Proceedings 1st European Symposium on Multimodal Communication University of Malta; Valletta; October 17-18; 2013 (pp. 41-50). Linköping University Electronic Press. (Linköping Electronic Conference Proceedings, 101).

Malicka-Kleparska, A. (2013). In search of causative structures in the root-based morphology: The case of polish roz-/roze-causatives. Studies in Polish Linguistics, 8(2), 75-102.

Maziarz, M., Piasecki, M., & Szpakowicz, S. (2012). Approaching plWordNet 2.0. In C. Fellbaum & P. Vossen (Eds.), Proceedings of the 6th Global WordNet Conference, Matsue, Japan (pp. 189-196). Global WordNet Association.

Maziarz, M., Piasecki, M., & Szpakowicz, S. (2013). The chicken-and-egg problem in wordnet design: Synonymy, synsets and constitutive relations. Language Resources and Evaluation, 47(3), 769-796. https://doi.org/10.1007/s10579-012-9209-9

Maziarz, M., Piasecki, M., Rudnicka, E., Szpakowicz, S., & Kędzia, P. (2016). plWordNet 3.0 - a comprehensive lexical-semantic resource. In N. Calzolari, Y. Matsumoto, & R. Prasad (Eds.), COLING 2016, 26th International Conference on Computational Linguistics, Proceedings of the Conference: Technical Papers, December 11-16, 2016, Osaka, Japan (pp. 2259-2268). ACL.

Maziarz, M., Piasecki, M., Szpakowicz, S., Rabiega-Wiśniewska, J., & Hojka, B. (2011). Semantic relations between verbs in Polish WordNet 2.0. Cognitive Studies | Études cognitives, 2011(11), 183-200. https://doi.org/10.11649/cs.2011.011

Maziarz, M., Szpakowicz, S., & Piasecki, M. (2012). Semantic relations among adjectives in Polish WordNet 2.0: A new relation set, discussion and evaluation. Cognitive Studies | Étudies cognitives, 2012(12), 149-179. https://doi.org/10.11649/cs.2012.011

Murphy, L. M. (2006). Meronymy. In K. Brown (Ed.), Encyclopedia of language & linguistics (2nd ed., pp. 13-15). Amsterdam: Elsevier. https://doi.org/10.1016/B0-08-044854-2/04838-0

Naskręt, T., Dziob, A., Piasecki, M., Saedi, C., & Branco, A. (2018). WordnetLoom - a multilingual wordnet editing system focused on graph-based presentation. In F. Bond, C. Fellbaum, & P. Vossen (Eds.), Proceedings of the 9th Global Wordnet Conference, Singapore, 8-12 January 2018. Global Wordnet Association.

Olszewska, T. (1986). Causativity as a linguistic phenomenon: A study based on English and Polish. Lublin: Uniwersytet Marii Curie-Skłodowskiej.

Pala, K., & Hlaváčková, D. (2007). Derivational relations in Czech WordNet. In Proceedings of the Workshop on Balto-Slavonic Natural Language Processing: Information Extraction and Enabling Technologies (pp. 75-81). Stroudsburg, PA: Association for Computational Linguistics.

Pease, A. (2011). Ontology: A practical guide. Angwin, CA: Articulate Software Press.

Piasecki M., & Koeva, S. (2017). WordNet relations in the Bulgarian-Polish bilingual perspective. In T. Aleksandrova & D. Blagoeva (Eds.), Proceedings of the International Jubilee Conference of the Institute for Bulgarian Language, (Sofia, 15-16 May 2017) (Vol. 1, pp. 285-296). Sofia: Institute for Bulgarian Language Prof. Lyubomir Andreychin, Bulgarian Academy of Sciences.

Piasecki, M., Szpakowicz, S., & Broda, B. (2009). A Wordnet from the Ground Up. Wrocław: Oficyna Wydawnicza Politechniki Wrocławskiej. Retrieved from http://www.dbc.wroc.pl/Content/4220/Piasecki_Wordnet.pdf

Piasecki, M., Szpakowicz, S., & Broda, B. (2010). Toward plWordNet 2.0. In P. Bhattacharyya, C. Fellbaum, & P. Vossen (Eds.), Principles, construction and application of Multilingual Wordnets: Proceedings of the Fifth Global WordNet (pp. 263-270). Mumbai: Narosa Publishing House.

Piasecki, M., Marcińczuk, M., Ramocki, R., & Maziarz, M. (2013). WordNetLoom: A WordNet development system integrating form-based and graph-based perspectives. International Journal of Data Mining, Modelling and Management, 5(3), 210-232. https://doi.org/10.1504/IJDMMM.2013.055861

Piasecki, M., Burdka, Ł., Maziarz, M., & Kaliński, M. (2016). Diagnostic tools in plWordNet development process. In Z. Vetulani, H. Uszkoreit, & M. Kubis (Eds.), Lecture Notes in Computer Science: Vol. 9561. Human Language Technology: Challenges for Computer Science and Linguistics: 6th Language and Technology Conference, LTC 2013, Poznań, Poland, December 7-9, 2013: Revised selected papers (pp. 255-273). Cham: Springer. https://doi.org/10.1007/978-3-319-43808-5_20

Šojat, K., & Srebačić, M. (2014). Morphosemantic relations between verbs in croatian wordnet. In Proceedings of the Seventh Global Wordnet Conference (pp. 262-267). Tartu: University of Tartu Press.

Vendler, Z. (1957). Verbs and times. The Philosophical Review, 66(2), 143-160. https://doi.org/10.2307/2182371

Vossen, V. (2002). EuroWordNet general document Version 3 (Technical report). University of Amsterdam.




Copyright (c) 2018 Agnieszka Dziob, Maciej Piasecki

License URL: http://creativecommons.org/licenses/by/3.0/pl/