Nie wszystkie badania humanistyczne znajdują zastosowanie w biznesie, jednak językoznawstwo posiada bardzo duży potencjał udziału we wdrożeniach komercyjnych. Dzieje się tak ze względu na współpracę lingwistyczno-informatyczną w projektach związanych z przetwarzaniem języka naturalnego. Jednym z tego typu projektów jest grant badawczy „Senti Cognitive Services – nowa generacja usług do automatyzacji marketingu i obsługi sieci społecznościowych oparta o metody sztucznej inteligencji”, realizowany w ramach Programu Operacyjnego Inteligentny Rozwój Komisji Europejskiej (POIR.01.01.01-00-0806/16), dotyczący nowej generacji usług do automatyzacji marketingu i obsługi sieci społecznościowych, opartej o metody sztucznej inteligencji. W jego realizację zaangażowana jest firma SentiOne oraz instytucje naukowe: Akademia Górniczo-Hutnicza i Politechnika Wrocławska we współpracy z Instytutem Slawistyki PAN, reprezentowanym przez dr Agnieszkę Pluwak.
„Senti Cognitive Service” to platforma służąca do automatycznego badania wizerunku branży lub produktu w internecie. W wyniku realizacji projektu powstaną trzy główne produkty: 1. automatyczne raporty wizerunkowe, działające na bazie semantycznych modeli do ekstrakcji informacji, 2. automatyczny system szybkiego powiadamiania o treściach kryzysowych z punktu widzenia wizerunku marki, 3. system do automatycznego podpowiadania odpowiedzi na często zadawane przez klientów pytania do implementacji w obsłudze klienta.
Zapotrzebowanie na automatyzację tego typu usług wynika z rosnących potrzeb rynku usług, w szczególności obsługi klienta, w dobie dynamicznie rozwijających się mediów społecznościowych, stanowiących obecnie podstawowy, masowy kanał kontaktu klienta z marką.
Modele semantyczne, budowane na podstawie teorii językoznawczych, takich jak np. teoria aktów mowy Austina i Searla, czy też teorii NLP (ang. natural language processing), takich jak np. ekstrakcja aspektów i cech produktu, najszerzej opisywana przez Binga Liu, wykorzystywane są w projekcie do budowy manuali tagowania korpusów. Zespół lingwistyczno-analityczny oznacza korpusy treningowe i testowe odpowiedniej próby, na podstawie których z pomocą algorytmów sztucznej inteligencji lub z użyciem metod heurystycznych budowane są klasyfikatory ekstrakcji danych o założonej w projekcie skuteczności. Dzięki tego typu pracy zespołu lingwistów i deweloperów powstają modele np. ekstrakcji aspektów produktu (inaczej bezpośrednich i niebezpośrednio wyrażonych opinii dotyczących produktów i ich aspektów typu cena czy jakość), klasyfikacji rodzaju tekstu pod względem aktu mowy (np. sugestia, opinia, lead sprzedażowy, opis doświadczenia związany z produktem lub usługą), treści kryzysowe (np. dla branży kosmetycznej są to kosmetyki testowane na zwierzętach), klasyfikacji emocji, zainteresowań użytkowników, streszczeń tekstów itd.
Dr Agnieszka Pluwak z Instytutu Slawistyki PAN pełni w projekcie rolę wykonawczyni i koordynatorki. Analizuje literaturę przedmiotową, przygotowuje manuale anotacji tekstu, nadzoruje pracę analityków i programistów, odpowiada za relacje z uczelniami oraz raportowanie.
Już po pierwszym etapie projektu „Senti Cognitive Services” pierwszy polski korpus języka potocznego oraz tager języka potocznego pojawiły się w Clarinie na otwartej licencji do pobrania z repozytorium. Więcej informacji wraz z aktualnościami o projekcie znajduje się na stronie: https://sentione.com/pl/wiedza/projekt-b-r-ue. W ramach projektu powstają też publikacje naukowe w języku angielskim, np. dotyczące korpusu języka potocznego.