Korpus dwujęzyczności polsko-niemieckiej LangGener
„Pokoleniowe zróżnicowanie języka: zmiany morfosyntaktyczne wywołane przez polsko-niemiecki kontakt językowy w mowie osób dwujęzycznych (LANGGENER)” – grant finansowany przez Narodowe Centrum Nauki oraz Niemiecką Wspólnotą Badawczą (Deutsche Forschungsgemeinschaft).
Zespół polski:
- kierownik: prof. dr hab. Anna Zielińska (Instytut Slawistyki PAN);
- wykonawcy: dr Irena Prawdzic (Instytut Slawistyki PAN), dr Barbara Alicja Jańczak (Uniwersytet Adama Mickiewicza w Poznaniu), dr Anna Jorroch (Uniwersytet Warszawski), dr hab. Felicja Księżyk (Uniwersytet Opolski).
Zespół niemiecki:
- kierownik: prof. Björn Hansen (Uniwersytet w Ratyzbonie);
- wykonawcy: mgr Anna Bučkova (Uniwersytet w Ratyzbonie), mgr Carolin Centner (Uniwersytet w Ratyzbonie), mgr Iga Kościołek (Uniwersytet w Ratyzbonie), prof. Marek Nekula (Uniwersytet w Ratyzbonie); dr Michał Woźniak (Instytut Języka Polskiego PAN, Uniwersytet w Ratyzbonie); konsultanci: prof. Sandra Birzer (Uniwersytet w Bambergu), prof. Bernhard Brehmer (Uniwersytet w Greifswaldzie); mgr Roman Fisun (Uniwersytet w Ratyzbonie).
Celem projektu jest zintegrowany opis niemiecko-polskiego bilingwizmu w Polsce i w Niemczech, uwzględniający zarówno aspekty lingwistyczne, jak i socjolingwistyczne. Głównym zadaniem podjętego przez nas przedsięwzięcia naukowego jest zbadanie, czy zmiany morfosyntaktyczne wywołane przez kontakt językowy w mowie osób dwujęzycznych są zróżnicowane pokoleniowo. Z jednej strony przedmiotem naszych zainteresowań jest dwujęzyczny mówca, a z drugiej procesy replikacji wzorów morfosyntaktycznych w obu językach: w polskim i niemieckim.
Ważnym rezultatem grantu jest multimodalny korpus dwujęzyczności polsko-niemieckiej LangGener, który oddajemy do użytku badaczy i badaczek. Korpus obejmuje ok. 78 godzin nagrań w języku polskim i niemieckim z 58 przedstawicielami dwóch generacji. Pierwszą generację tworzą osoby urodzone przed 1945 rokiem w Niemczech, na ziemiach przyłączonych do Polski w 1945 roku. Nazywamy tę grupę Generacja Polska/Generation Polen, skrót GP – od kraju zamieszkania, ponieważ osoby wchodzące w jej skład pozostały na ziemiach swojego urodzenia po przesunięciu granic. Drugą generację stanowią osoby urodzone także na tych terenach, ale po 1945 roku, czyli już w Polsce. Przedstawiciele tej generacji wyemigrowali do Niemiec i tam mieszkają. Nazywamy tę generację Generacja Niemcy/Generation Deutschland, skrót GD. Korpus jest anotowany gramatycznie i socjolingwistycznie (!).
Użytkownikom korpusu oddajemy do dyspozycji nagrania i ich transkrypcje wykonane metodą półortograficzną, przystępną dla wszystkich odbiorców. Jednym z celów projektu była dokumentacja wymierających dialektów niemieckich na terenie zachodnio-północnej Polski. Dlatego teksty nagrane w języku niemieckim w Polsce zostały przetranskrybowane z zachowaniem cech dialektalnych. Dodatkowo korpus został uzupełniony o bogate metadane zawierające: kryptonim mówcy; rok urodzenia; generację (GD ; GP); płeć; rok imigracji (dla GD); poziom wykształcenia (podstawowe niepełne, podstawowe pełne, zawodowe, średnie, wyższe), zawód; region urodzenia; miejsce urodzenia; region zamieszkania i miejsce zamieszkania. Ponadto metadane zawierają opisy idiolektów; przy czym szczegółowo opisane są cechy dialektów niemieckich w Polsce.
Gramatycznie zaanotowano zjawiska kontaktu językowego (kalki), wskazując frazę składniową, w obrębie której dane zjawisko wystąpiło. Typy fraz wyodrębniono na podstawie wykładnika, który określa właściwości gramatyczne danej grupy wyrazów. Wyróżniono następujące typy fraz: nominalną, czasownikową, przyimkową, przymiotnikową, przysłówkową oraz zdaniową. Zjawiskami kontaktu językowego są z kolei: bezpośrednia replikacja morfemów i form fonologicznych z języka źródłowego; replikacja wzorców, czyli dystrybucji, znaczenia lub związku formy z funkcją według modelu języka źródłowego (sama forma nie jest przy tym replikowana); inne różnice w stosunku do ponadregionalnej odmiany danego języka, których nie można wyjaśnić zastosowaniem wzorców z języka źródłowego; code-switching, czyli przełączanie kodu językowego wewnątrz jednej wypowiedzi; odchylenia w zakresie porządku składniowego; autokorektę, czyli wyrażenia i sformułowania, które mówcy sami identyfikują jako nieadekwatne lub niepoprawne i zastępują je innymi wyrażeniami i sformułowaniami.
Nowatorska anotacja socjolingwistyczna ma ułatwić opracowywanie wywiadów pod względem treści odnoszących się do biografii językowych mówców. Biografia językowa to historia przyswajania i używania języków w ciągu całego życia człowieka, z uwzględnieniem nabywania, używania, zmiany i utraty języka w politycznym i społecznym kontekście. Anotacja opiera się na trzech kategoriach: etapów życia (czyli: wczesnego dzieciństwa, dzieciństwa, wieku szkolnego, wieku dorastania, dorosłości i wieku podeszłego), sfer użycia języka/domeny (czyli: rodziny/domu, sąsiedztwa/miejsca zamieszkania, religii/wyznania, przyjaciół/znajomych, edukacji, pracy, administracji, mediów/prasy, telewizji, internetu, związków mniejszości narodowych, podróży, ego dokumentów/pamiętników, listów) oraz konceptualizacji dwujęzyczności (czyli: przeżycia językowego, ideologii językowych, zarządzania językiem).
Zespół germanistów i slawistów z Polski i Niemiec ma nadzieję, że korpus LangGener spotka się z zainteresowaniem i będzie wykorzystywany przez językoznawców, kulturoznawców, socjologów, antropologów i przedstawicieli innych dyscyplin naukowych do własnych badań.
Link do opisu projektu na stronie Uniwersytetu w Ratyzbonie:
https://www.uni-regensburg.de/forschung/language-across-generations/startseite/index.html
Korpus dwujęzyczności czesko-niemieckiej
https://www.korpus.cz/kontext/query?corpname=jazyky_v_migraci
Drugim ważnym rezultatem grantu jest multimodalny korpus dwujęzyczności czesko-niemieckiej LangGener, który może służyć do badań nad akwizycją języka i erozją językową w kontekście migracji, a konkretnie do badań nad akwizycją języka niemieckiego jako drugiego języka i erozji czeskiego jako pierwszego języka w Niemczech (Bawaria). Ponadto można go wykorzystać do dociekań nad językiem mówionym oraz zagadnieniami socjolingwistycznymi i dialektologicznymi.
Podprojekt niemiecko-czeski obejmował dwie grupy osób dwujęzycznych należące do tego samego pokolenia – repatriantów i migrantów. Korpus obejmuje transkrypcje 16 wywiadów o łącznej długości 27,5 godziny z 20 informatorami zarówno z pochodzeniem, jak i bez pochodzenia sudecko-niemieckiego. Mówcy urodzili się ok. 1955 r. i po ukończeniu 12 roku życia, uważanego za wiek krytyczny, wyjechali z Czechosłowacji. W rozmowach, które nagrano w latach 2018, 2019 i 2020 po niemiecku i czesku, respondenci opowiadają o swoich biografiach językowych w Czechach i Niemczech.
W transkryptach wywiadów zidentyfikowano, otagowano oraz zinterpretowano ilościowo zjawiska kontaktu i izolacji językowej. Oprócz replikacji materiałowych i strukturalnych, które sklasyfikowano według ich charakteru składniowego, otagowano także przełączania kodu, nietypowy szyk składniowy, autokorekty i inne odchylenia od baseline danego języka.
Monografia
Efektem projektu jest monografia w wolnym dostępie:
Soziolinguistik trifft Korpuslinguistik. Deutsch-polnische und deutsch-tschechische Zweisprachigkeit. Redakcja naukowa: Björn Hansen, Anna Zielińska. Universitätsverlag Winter GmbH. doi: https://doi.org/10.33675/2022-82538591
Autorzy i autorki: Aneta Bučková, Carolin Centner, Björn Hansen, Barbara Alicja Jańczak, Anna Jorroch, Iga Kościołek, Felicja Księżyk, Marek Nekula, Irena Prawdzic, Michał Woźniak, Anna Zielińska
Międzynarodowy zespół slawistów i germanistów przedstawia problemy i wyzwania naukowe związane z tworzeniem korpusu mówionego dwujęzyczności polsko-niemieckiej LangGener oraz subkorpusu bilingwizmu czesko-niemieckiego: od tworzenia koncepcji i sporów naukowych, opracowania metod prowadzenia badań terenowych i pozyskiwania wywiadów socjolingwistycznych po szczegółowe rozwiązania techniczne. Głównym celem monografii jest pokazanie napięć i trudności w łączeniu problematyki socjolingwistycznej i lingwistyki korpusowej. Tom stanowi kompendium wiedzy o tworzeniu ukierunkowanego socjolingwistycznie korpusu językowego. Zespół ma nadzieję, że monografia spotka się z zainteresowaniem i zainspiruje językoznawców do tworzenia korpusów socjolingwistycznych.