DOI: https://doi.org/10.11649/cs.2016.004

Towards Application of Speech Act Theory to Opinion Mining

Agnieszka Magdalena Pluwak

Abstract


Towards the Application of Speech Act Theory to Opinion Mining

The paper refers to the pragmatics’ perspective on opinion mining in Polish and English, inspired by the discrepancy between the coverage of sentiment analysis and the market demand. An analysis of speech acts expressed in opinion texts reveals that almost half of all opinions include ways of indirect evaluation that might not get extracted while applying traditional methods of sentiment analysis based on direct evaluative vocabulary and polarity lexicons. Coding of sentiment with respect to speech acts could vastly broaden data mining results within an NLP-system.

 

O zastosowaniu teorii aktów mowy w ekstrakcji danych z tekstów opinii internetowych

Jedno z aktualnych zagadnień językoznawstwa komputerowego, jakim jest automatyczne badanie wydźwięku wypowiedzi, nie uwzględniło dotychczas w wystarczającym stopniu pragmatyki językoznawczej, np. aktów mowy Austina (1961) i Searla (1969), a zatem również implicytnych sposobów wyrażania ewaluacji. Tymczasem podejście od pragmatyki ku konstrukcjom przełożonym na reguły programistyczne umożliwiłoby nie tylko szersze spojrzenie na analizę sentymentu, ale też zbliżyłoby automat do sposobu, w jaki odbiera go człowiek. W szczególności chodzi tu sposoby wyrażania (nie)zadowolenia wykraczające poza poziom leksykalny (bez nacechowanej negatywnie leksyki), typu Nigdy więcej tam nie pójdę.

Artykuł prezentuje: 1. aktualne podejścia do analizy wydźwięku w lingwistyce komputerowej, 2. propozycję zastosowania podejścia pragmatycznego, 3. wyniki badania próbki tekstów opinii internetowych pod kątem występowania w nich aktów mowy, 4. propozycję utworzenia reguł ekstrakcji danych na ich podstawie. Zaprezentowane podejście zakłada hipotezę wtórnej oralności, czyli tego, że język opinii jest zapisanym językiem mówionym.


Keywords


sentiment analysis; implicit sentiment; speech acts

Full Text:

PDF (in English)

References


Austin J. (1962). How to do things with words. New York: Oxford University Press.

Balahur A., Steinberger R. (2009). Rethinking Sentiment Analysis in the News: from Theory to Practice and back. Proceedings of WOMSA.

Bauman Z. (2013). Lecture "Człowiek. Granice", Malta Festival, 28th June 2013 Poznań.

Brody S., Elhadad N. (2010). An unsupervised aspect-sentiment model for online reviews. Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics, pp. 804-812.

Cambria, E., Schuller, B., Xia, Y., & Havasi, C. (2013). New avenues in opinion mining and sentiment analysis. IEEE Intelligent Systems, 28(2), 15-21. http://dx.doi.org/10.1109/mis.2013.30.

Chiticariu, L., Li, Y., & Reiss, F. R. (2013). Rule-based information extraction is dead! Long live rule-based information extraction systems! In Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing (pp. 827-832). Seattle, Washington, USA, 18-21 October 2013.

Eiser, J. R. (2007). Attitudes and the use of evaluative language: A two-way process. Journal for the Theory of Social Behavior, 5(2), 235-248. http://dx.doi.org/10.1111/j.1468-5914.1975.tb00354.x

Ensink T. & Sauer Ch. (2003). Framing and Perspectivising in Discourse. John Benjamins Publishing Company.

Field, D. & Ramsay, A. (2006). How to change a person’s mind: Understanding the difference between the effects and consequences of speech acts. In Proceedings of the 5th Workshop on Inference in Computational Semantics (ICoS-5), 20-21 April 2006 (pp. 27-36). Retrieved from http://anthology.aclweb.org//W/W06/W06-3903.pdf

Grzegorczykowa R. (2010). Wprowadzenie do semantyki językoznawczej. PWN.

Goldberg, A. E. (2003). Constructions: a new theoretical approach to language. Trends in Cognitive Sciences, 7(5):219-224.

Goldberg, A. E. (1995). Constructions: A construction grammar approach to argument structure. University of Chicago Press.

Hu, M. & Liu, B. (2004). Mining opinion features in customer reviews. In Proceedings of Nineteenth National Conference on Artificial Intelligence (pp. 755-760).

Koseska-Toszewa, V., Korytkowska, M., & Roszko, R. (2007). Polsko-bułgarska gramatyka konfrontatywna. Warszawa: Dialog.

Kubaszczyk, J. (1999). Kognition und Übersetzen: Über das Übersetzen von Konzepten. Glottodidactica, 27, 77-89.

Kubaszczyk, J. (2006). Übersetzungsäquivalente der substantivierten Adjektivwörter vom Typ das Neue, das Schöne (neutrale Abstrakta) im Polnischen. Glottodidactica, 32, 73-85.

Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies, 5(1) , 1-167. http://dx.doi.org/10.2200/S00416ED1V01Y201204HLT016.

Lakoff G. (2002). Moral Politics: How Liberals and Conservatives Think. University of Chicago Press.

Meng, X. & Wang, H. (2009). Mining user reviews: From specification to summarization. In Proceedings of the ACL-IJCNLP 2009 Conference Short Papers (pp. 177-180). Suntec, Singapore, 4 August 2009. Stroudsburg, PA, USA: Association for Computational Linguistics. http://dx.doi.org/10.3115/1667583.1667637.

Meyer M., Titscher S., Vetter E., Wodak R. (2000). Methods of Text and Discourse Analysis. Sage Verlag, London, Thousand Oaks, New Delhi.

Nasykawa, T. & Yi, J. (2003). Sentiment analysis: Capturing favorability using natural language processing. K-CAP’03, October 23-25, 2003, Sanibel Island, Florida, USA.

Novielli, N. & Strapparava, C. (2009). Towards unsupervised recognition of dialogue acts. In Proceedings of the NAACL HLT Student Research Workshop and Doctoral Consortium (pp. 84-89). Boulder, Colorado, June 2009. 2009 Association for Computational Linguistics. http://dx.doi.org/10.3115/1620932.1620947.

Ong, W. (1982). Orality and literacy: The technologizing of the world. London: Routledge.

Perrault, C. R. & Allen, J. (1980). A plan-based analysis of indirect speech acts. American Journal of Computational Linguistics, 6(3-4).

Pluwak, A., Korczyński, W., & Kisiel-Dorohinicki, M. (2016). Adapting a constituency parser to user-generated content in Polish opinion mining. Computer Science, 17(1), 23. http://doi.org/10.7494/csci.2016.17.1.23.

Reschke, K., Vogel, A., & Jurafsky, D. (2013). Generating recommendation dialogs by extracting information from user reviews. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (pp. 499-504). Sofia, Bulgaria, August 4-9 2013.

Sadaba T. (2006). Framing: Una Teoria Para Los Medios de Communicacion. Ulzama, Pamplona.

Searle, J. R. (1969). Speech acts - an essay in the philosophy of language. Cambridge: Cambridge University Press. http://dx.doi.org/10.1017/CBO9781139173438.

Sinclair, J. (1996). The search for units of meaning. Textus, 9(1), 75-106.

Somasundaran, S. (2010). Discourse-level relations for opinion analysis (Unpublished Doctoral Dissertation at John Hopkins University).

Tokarski R. (2014). Światy za słowami. Wykłady z semantyki leksykalnej. Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej.

Vanderveken, D. (1990). Meaning and speech acts (Vol. 1, Principles of language use). Cambridge, England: Cambridge University Press.

Zhang L., Bing L. (2011). Extracting Resource Terms for Sentiment Analysis. Proceedings of the International Joint Conference on Natural Language Processing (pp. 1171-1179).

Zhang, Q., Qian, J., Chen, H., Kang, J., & Huang, X. (2013). Discourse level explanatory relation extraction from product reviews using first-order logic. In Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing (pp. 946-957). Seattle, Washington, USA, 18-21 October 2013.




Copyright (c) 2016 Agnieszka Magdalena Pluwak

License URL: http://creativecommons.org/licenses/by/3.0/pl/