logo

logo uswps nazwa 3

Serial „Manhunt: Unabomber”, dostępny w Polsce na platformie Netflix, to oparta na faktach historia poszukiwania jednego z najsłynniejszych amerykańskich terrorystów ubiegłego wieku. Głównym bohaterem serialu jest James Fitzgerald, postać autentyczna, profiler FBI, który doprowadza do zidentyfikowania terrorysty i jego aresztowania, a to wszystko dzięki stosowanej przez siebie technice „profilowania lingwistycznego”, która stała się częścią intensywnie rozwijanej w USA „lingwistyki kryminalistycznej”. W drugim z pięciu artykułów poświęconych detektywistycznym aspektom językoznawstwa prof. dr hab. Jadwiga Linde-Usiekniewicz z Uniwersytetu SWPS opowie, jak tworzono profil lingwistyczny Unabombera.

Wpis bardzo lingwistyczny1: profil lingwistyczny Unabombera2

Przed sprawą Unabombera FBI wykorzystywało tzw. „profil behawioralny sprawcy”. Działo się tak wtedy, gdy policja lub właśnie FBI nie mogły zawęzić kręgu podejrzanych tradycyjnymi metodami policyjnymi, zwłaszcza w przypadku seryjnych morderstw i ataków terrorystycznych. Podstawą takiego profilu były z jednej strony obserwacje z miejsca przestępstwa i ślady kryminalistyczne, np. sposób popełnienia morderstwa, w tym np. budowa bomby, z drugiej strony – szczególnie w przypadku zabójców seryjnych – pewne powtarzające się elementy, świadczące o stosowaniu charakterystycznego dla sprawcy rytuału. Wykorzystywano też znane zachowania wcześniej złapanych przestępców oraz ich dane demograficzne: wiek, w USA rasa, wykształcenie, wychowanie itd. Rozumowano w skrócie następująco: jeżeli np. większość dotychczasowych zamachów bombowych (albo wszystkie, gdzie sprawcę wykryto), popełniali mężczyźni w wieku 25-30 lat, biali, niewykształceni, to jest duże prawdopodobieństwo, że kolejne ataki są dziełem takiej właśnie osoby. Tego typu informacje oczywiście nie pozwalają zidentyfikować sprawcy, ale pozwalają zawęzić krąg podejrzanych.

Istotą profilowania behawioralnego jest zatem porównanie cech popełnianego przestępstwa z innymi przestępstwami i założenie, że poszukiwany sprawca jest podobny do złapanych na podobnym przestępstwie. Natomiast profilowanie lingwistyczne, opisane w pierwszym wpisie, pozwala na ustalenie pewnych cech sprawcy, jeżeli oczywiście ten sprawca coś napisał, wspólnych grupie ludzi niemających zwykle nic wspólnego z przestępstwami. Profil behawioralny Unabombera opisywał osobę młodą i słabo wykształconą. Z profilu lingwistycznego sporządzonego przez Rogera Shuya na podstawie listów Unabombera do prasy i liczącego kilkadziesiąt stron manifestu, zatytułowanego Industrial Society and Its Future („Społeczeństwo przemysłowe i jego przyszłość”), wyłaniał się zupełnie inny obraz.

Po pierwsze, autor nie mógł być człowiekiem niewykształconym. Początkowo jednym z dodatkowych argumentów za takim opisem były pozorne błędy ortograficzne, np. pojedyncze litery tam, gdzie powinny być podwojone, np. w słowie willfully pisanym wilfully Jednak Shuy zauważył, że autor listów i manifestu jest w swojej pisowni bardzo konsekwentny, a taka uproszczona pisownia była w latach 40.-50. XX wieku stosowana w wychodzącej w Chicago gazecie codziennej „Chicago Tribune”. Jej właściciel był zwolennikiem radykalnego uproszczenia angielskiej ortografii i wymuszał na swoich dziennikarzach taką właśnie pisownię. Swoją drogą – szkoda, że mu się nie udało przeforsować tych koncepcji – byłoby nam dużo łatwiej pisać po angielsku. Te wszystkie elementy pokazano w serialu.

Ponadto w tekstach Unabombera pojawiały się słowa książkowe, świadczące o wykształceniu, takie jak np. tautology (tautologia). Autor stosował długie, rozbudowane i poprawnie skonstruowane zdania, w dodatku używał wyszukanych form gramatycznych. Ten aspekt jest w serialu mniej obecny, bo gramatyka jest mniej filmowa.

Podsumowując: profil lingwistyczny autora listów do prasy i manifestu wskazywał na to, że jest to osoba co najmniej 50-letnia, z wyższym wykształceniem w naukach ścisłych, która spędziła dzieciństwo lub wczesną młodość w Chicago, pochodziła z północnej części USA, lub tam spędziła większość życia, mieszkała jakiś czas w Kalifornii, wywodziła się z rodziny katolickiej. Wszystkie te hipotezy okazały się trafne, gdy zidentyfikowano i aresztowano Unabombera: Teda Kaczynskiego.

Industrial Society and Its Future w formie przypominał pracę magisterską lub doktorską, świadczył także o erudycji autora w zakresie nauk społecznych, niemniej – mimo wspomnianego wyżej wyszukania językowego – pod względem stylu i interpunkcji nie spełniał wymogów stawianych pracom w dziedzinie nauk humanistycznych i społecznych. Shuy doszedł do wniosku, że autor musiał mieć wykształcenie wyższe, ale w dziedzinie nauk ścisłych. Po otrzymaniu manifestu FBI zwróciło się zresztą do wykładowców akademickich z zapytaniem, czy w autorze tego tekstu nie rozpoznają jakiegoś swojego byłego studenta. Postępowanie to nie przyniosło żadnych efektów, a w serialu przedstawione jest jako zebranie naukowców, samych starszych mężczyzn, które przeradza się w kłótnię na temat wyższości dyscyplin humanistycznych i społecznych nad naukami ścisłymi albo odwrotnie. Jedyne sensowne pytanie – na temat tytułu, jakim opatrzona jest errata – zadaje Natalie Shilling, filmowe alter ego (tfu, serialowy odpowiednik) Shuya. Po drugie, autor tekstów musiał być starszy niż to wynikało z profilu behawioralnego. Jeżeli był czytelnikiem Chicago Tribune w latach 50., nawet jako młody chłopiec, to w latach 90. musiał mieć ponad pięćdziesiąt lat, a nie trzydzieści, czy nawet czterdzieści, co sugerowały kolejne profile behawioralne.

Warto bowiem wiedzieć, że ludzie przyzwyczajają się do ortografii, jaka obowiązuje w czasach, gdy nabywają sprawności w pisaniu. Jeżeli w ich dorosłym życiu reguły ortografii się zmienią, muszą się na nowo przyzwyczajać i albo im się to udaje, albo nie. Moja bardzo dobrze wykształcona babcia, urodzona w 1900 roku, do końca życia pisała niema zamiast nie ma w znaczeniu ‘nie jest’, a moja jeszcze lepiej od niej wykształcona matka pisała łącznie wiele wyrażeń pisanych dziś rozdzielnie. Mnie w języku polskim trudność sprawia zmiana reguł rządzących pisownią nie z imiesłowami odmiennymi. Odruchowo w pewnych sytuacjach piszę je rozdzielnie, a dopiero później poprawiam. Z kolei w hiszpańskim dopadła mnie inna reforma. Gdy uczyłam się tego języka dekady temu, obowiązywała zasada dotycząca zapisu akcentu: pisownią z akcentem graficznym i bez odróżniało się wyrazy homonimiczne, np. zaimki wskazujące używane samodzielnie i w połączeniu z rzeczownikami, np. éste i este ‘ten’, a także sólo ‘tylko’ i solo ‘sam’. W 2010 r. Real Academia de la Lengua (Królewska Akademia Języka) zniosła to rozróżnienie, a mimo to wciąż stawiam te akcenty, by potem przy redagowaniu tekstu je skwapliwie usuwać.

Innych elementów profilu w serialu nie pokazano, choćby tego, że o wieku autora świadczył zestaw cytowanych w manifeście prac: pochodziły one z lat 70., co świadczyło o tym, że autor musiał studiować w tym właśnie okresie. Co więcej, że w pewnym momencie zerwał kontakt ze światem nauki.

 

Wśród pozostałych cech, pozwalających ustalić wiek autora, Shuy wymienia między innymi używane przez niego słowo broad (pogardliwe określenie kobiety, bliskie współczesnemu polskiemu laska, ale w latach 90. już przestarzałe), Negro (uznane za obraźliwe pod koniec lat 60.) – zwłaszcza w partiach manifestu, gdzie akademicki styl autora się załamywał – a także używanie wyłącznie form męskich his, him (jego) w zdaniach ogólnych, zamiast używanych powszechnie w latach 90. form inkluzywnych, np. his or her (jej lub jego). Dodatkową poszlaką na temat wieku autora było użycie wyrażenia Holy Robots, używanego przez Robina w telewizyjnym serialu dla młodzieży z lat 60opartym na komiksie o Batmanie.

Analizując teksty Unabombera, Shuy ustalił nie tylko, że prawdopodobnie w latach 50. musiał on mieszkać w Chicago, lecz także, że najprawdopodobniej przez jakiś czas mieszkał na zachodzie USA. Świadczyło o tym użycie rzeczownika sierra zapożyczonego z hiszpańskiego i używanego głownie w Kalifornii, w odniesieniu do łańcucha gór lub wzgórz. Jednak w tekście nie występowały inne wyrazy charakterystyczne dla tego regionu, takie jak np. fork w znaczeniu ‘odnoga strumienia’ czy mesa, też z hiszpańskiego, oznaczającego płaskowyż. Shuy doszedł do wniosku, że autor owszem, mieszkał jakiś czas w Kalifornii, ale stamtąd nie pochodził, zwłaszcza, że używał też innego wyrażenia charakterystycznego dla mieszkańców północnych regionów USA, mianowicie rearing children ‘wychowanie dzieci’, a nie raising children.

Badając inne charakterystyczne sformułowania, zauważył, że Unabomber posługuje się on zwrotami zaczerpniętymi z Biblii i z języka religijnego. Pewne wyrażenia oraz treści manifestu pozwoliły także sformułować hipotezę, że autor tekstów otrzymał wychowanie religijne w konfesji katolickiej.

Podsumowując: profil lingwistyczny autora listów do prasy i manifestu wskazywał na to, że jest to osoba co najmniej 50-letnia, z wyższym wykształceniem w naukach ścisłych, która spędziła dzieciństwo lub wczesną młodość w Chicago, pochodziła z północnej części USA, lub tam spędziła większość życia, mieszkała jakiś czas w Kalifornii, wywodziła się z rodziny katolickiej. Wszystkie te hipotezy okazały się trafne, gdy zidentyfikowano i aresztowano Unabombera: Teda Kaczynskiego.

W następnych odcinkach między innymi:

 

someone

O autorce

prof. dr hab. Jadwiga Linde-Usiekniewicz – kierownik Katedry Iberystyki, Wydziału Kulturoznawstwa i Filologii SWPS. Iberysta, językoznawca, specjalista w zakresie semantyki i pragmatyki kontrastywnej, struktur informacyjnych oraz relacji między semantyką, składnią a pragmatyką.

Przypisy

 

Czytelnikom i czytelniczkom mniej zainteresowanym językoznawstwem sugeruję pominięcie tego odcinka, jako bardzo technicznego.
Ten wpis w całości oparty jest na książce R. Shuya, „The Language of Murder Cases: Intentionality, Predisposition, and Voluntariness”, Oxford 2014. Wszystkie informacje dotyczące Unabombera pochodzą z rozdziału zatytułowanego „Linguistic Profiling”.

Serial „Manhunt: Unabomber”, dostępny w Polsce na platformie Netflix, to oparta na faktach historia poszukiwania jednego z najsłynniejszych amerykańskich terrorystów ubiegłego wieku. Głównym bohaterem serialu jest James Fitzgerald, postać autentyczna, profiler FBI, który doprowadza do zidentyfikowania terrorysty i jego aresztowania, a to wszystko dzięki stosowanej przez siebie technice „profilowania lingwistycznego”, która stała się częścią intensywnie rozwijanej w USA „lingwistyki kryminalistycznej”. W trzecim z pięciu artykułów poświęconych detektywistycznym aspektom językoznawstwa prof. dr hab. Jadwiga Linde-Usiekniewicz z Uniwersytetu SWPS opowie o znaczeniu profilowania lingwistycznego na długo przed pojawieniem się lingwistyki jako dziedziny nauki.

Profilowanie lingwistyczne jest starsze niż lingwistyka

Językoznawstwo, czyli inaczej lingwistyka, jako odrębna dyscyplina wykształciło się dopiero w XIX wieku. Nie znaczy to oczywiście, że wcześniej nie zajmowano się językiem i nie zastanawiano się nad jego naturą. Podobnie, profilowanie lingwistyczne, czyli rozpoznawanie, czy mówiący jest członkiem naszej społeczności albo tym, za kogo się podaje, jest znacznie starsze.

Wspomniany w poprzednim odcinku Roger Shuy1 jako przykład, być może najstarszej znanej wzmianki o profilowaniu lingwistycznym, podaje tekst Księgi Sędziów:

4 Wówczas Jefte zebrał wszystkich mężów z Gileadu i rozpoczął walkę z Efraimitami. Mężowie z Gileadu pokonali Efraimitów, gdyż ci mówili: «Jesteście zbiegami z Efraima, o Gileadczycy, którzy przebywacie wśród Efraimitów i Manassytów». 5 Następnie Gileadczycy odcięli Efraimitom drogę do brodów Jordanu, a gdy zbiegowie z Efraima mówili: «Pozwól mi przejść», Gileadczycy zadawali pytanie: «Czy jesteś Efraimitą?» – A kiedy odpowiadał: «Nie», 6 wówczas nakazywali mu: «Wymówże więc Szibbolet». Jeśli rzekł: Sibbolet – a inaczej nie mógł wymówić – chwytali go i zabijali u brodu Jordanu. Tak zginęło przy tej sposobności czterdzieści dwa tysiące Efraimitów2

Gileadczycy wykorzystali fakt, iż Efraimici mówili innym dialektem języka hebrajskiego: przyjmuje się, że tam, gdzie w wymowie Gileadczyków pojawiał się dźwięk zbliżony do polskiego sz (spółgłoska szczelinowa przedniojęzykowo-dziąsłowa), w dialekcie Efraimitów występował raczej dźwięk zbliżony do polskiego s, (spółgłoska szczelinowa przedniojęzykowo-zębowa). Podstawą takiego wnioskowania jest zastosowany w oryginalnej Księdze Sędziów zapis: wymowę Gileadczyków oddano stosując znak ש, natomiast wymowę Efraimitów – stosując znak ס (niektórzy badawcze twierdzą, że być może te zapisy nie oddają dobrze faktycznej wymowy, a jedynie po prostu różnicę między sposobem wymawiania). Samo słowo szibbolet najprawdopodobniej było homonimiczne i oznaczało kaczan kukurydzy lub strumień/ prąd rzeczny3. Część badaczy sugeruje, że ze względu na sytuację (bliskość rzeki) musiało chodzić o znaczenie odnoszące się do wody. Jeżeli faktycznie były to homonimy, nie ma to znaczenia.

Słowo szybolet (bo taka jest jego polska pisownia) lub jego odpowiedniki oddawane inną pisownią to słowo międzynarodowe, odnotowane w bardzo wielu językach. Słownik języka polskiego PWN podaje następującą definicję: «hasło rozpoznawcze, często zawierające głoskę albo wyraz, których cudzoziemiec nie potrafi wymówić»4.

Można znaleźć wiele przykładów zastosowania takich haseł w dawnej i niedawnej historii. Trudne dla cudzoziemca lub mieszkańca innego regionu słowa wykorzystywane są do identyfikacji wroga. Ponadto można – w celu zabezpieczenia się przed skrytym atakiem nieprzyjaciela na własne pozycje – przyjąć jako hasło lub odzew słowo lub wyrażenie, będące właśnie szyboletem. Wiele źródeł podaje, że w czasie II wojny światowej Amerykanie w Europie bardzo często tworzyli hasła z wyrazów zawierających th lub w, np. wishing well ‘studnia życzeń/ życząc dobrze’; Niemcy mieli kłopoty z ich poprawnym wymówieniem, gdyż dźwięków takich nie ma w niemieckim, i byli rozpoznawani przez wartowników. Z kolei na Pacyfiku Amerykanie stosowali hasła z l lub r, gdyż w japońskim nie są to odrębne fonemy, czyli dźwięki pozwalające odróżnić odrębne wyrazy, lecz tzw. warianty tego samego fonemu, wymawiane wymiennie. Takim słowem, pozwalającym od razu rozpoznać Japończyka, było lollapaloosa (do tej kwestii jeszcze wrócimy w kolejnym odcinku).

Trudne dla cudzoziemca lub mieszkańca innego regionu słowa wykorzystywane są do identyfikacji wroga. Ponadto można – w celu zabezpieczenia się przed skrytym atakiem nieprzyjaciela na własne pozycje – przyjąć jako hasło lub odzew słowo lub wyrażenie, będące właśnie szyboletem.

W angielskojęzycznej Wikipedii w haśle shibbolet można znaleźć wiele przykładów historycznych szyboletów. Czasami historycy języka i językoznawcy kwestionują ich autentyczność, ale są wspominane w źródłach historycznych. Być może dlatego, że autorzy tych zapisów też potrafili przeprowadzać intuicyjne profilowanie lingwistyczne i wiedzieli, że wrogowie wymawialiby nawet te wymyślone słowa inaczej niż swoi.

Z kolei polska Wikipedia wspomina dwa, jeden z historii Polski, drugi z historii Ameryki Łacińskiej. Pierwszy z nich to wykorzystanie frazy „soczewica, koło, miele i młyn” dla odróżnienia mieszczan niemieckich od polskich w Krakowie, po stłumieniu buntu wójta Alberta (1311). Mieszczaństwo niemieckie, właśnie pod wodzą Alberta, było przeciwne Władysławowi Łokietkowi i sprzyjało czeskiemu królowi, Janowi Luksemburczykowi, przed którym otworzyło zresztą bramy miasta. Po stłumieniu buntu, mieszczan niemieckich represjonowano, a testem polskości miało być wspomniane wyżej wyrażenie. Istnieje wiele wzmianek na ten temat w kilku popularnych opracowaniach. Chociaż, jak przekonująco pisze bloger Ryuuk:

Ten tzw. test polskości jest jednak bardzo mało prawdopodobny. Jedynym źródłem jest „Rocznik Krasińskich”, znany z XVI-wiecznej kopii. Poza tym, gdyby faktycznie w ten sposób karano śmiercią Niemców, czy też nie-Polaków, to dokonano by prawdziwej rzezi w Krakowie, bo przecież polskich mieszczan było wtedy naprawdę niewielu…5

Znacznie bardziej krwawe i tym razem prawdziwe jest drugie wspomniane w polskiej Wikipedii wydarzenie, a mianowicie „masakra pietruszkowa” (hiszp. la masacre de perejil, fr. massacre du persil), która miała miejsce w październiku 1937 r. w Dominikanie: hiszpańskojęzycznej republice dzielącej wyspę Haiti z francuskojęzycznym państwem Haiti. Oprócz francuskiego (wtedy jedynego języka oficjalnego Republiki Haiti) używany tam jest tzw. haitański kreolski, oparty częściowo na francuskim, ale ze znaczącymi zmianami również w wymowie. Haitański kreolski jest obecnie drugim językiem oficjalnym Republiki Haiti.

Sytuacja ekonomiczna Republiki Haiti była znacznie gorsza niż Republiki Dominikany. Haitańczycy nielegalnie przekraczali granicę Dominikany i zatrudniali się w rolnictwie. Zgadzali się na niemal niewolnicze warunki pracy, trudno się więc dziwić, że właściciele ziemscy woleli zatrudniać właśnie ich, a nie Dominikańczyków6. Brzmi znajomo? Dalej też będzie znajomo, tylko jeszcze gorzej.

Kryzys ekonomiczny końca lat dwudziestych XX wieku i jego skutki dla gospodarki Dominikany spowodowały wzrost nastrojów antyhaitańskich, skierowanych przeciwko ekonomicznym migrantom7. Według niektórych badaczy elementem rosnącej niechęci do przybyszów był rasizm (skąd my to znamy?): wśród Haitańczyków znacznie większa jest przewaga osób czarnoskórych, potomków dawnych niewolników, niż wśród mieszkańców Dominikany. Niemniej ważną rolę w potęgowaniu niechęci do przybyszów odgrywały względy ekonomiczne i demograficzne. Ówczesny dyktator Republiki Dominikany, Rafael Leónidas Trujillo zagrał kartą narodowościową: zaczął mówić o zagrożeniu „pokojową inwazją [!] Haitańczyków, którzy mieliby zająć całą wyspę”8 – paralele nasuwają się same.

W rezultacie 12 października 1937 roku doszło do masakry, w której zginęło między 17 a 35 tysięcy haitańskich migrantów. Była to akcja wojskowa, zarządzona przez dyktatora. W celu odróżnienia Haitańczyków od Dominikańczyków żołnierze pokazywali osobom czarnoskórym pietruszkę (po hiszpańsku perejil, wymawiane w przybliżeniu [perechil] z akcentem na ostatnią sylabę) i kazali ją nazwać. Czarnoskórzy Dominikańczycy, mówiący po hiszpańsku, nie mieli problemu z wymówieniem tego słowa, natomiast Haitańczycy, posługujący się wspomnianym już haitańskim kreolskim, nie byli w stanie tego zrobić. W haitańskim kreolskim nie ma dwóch dźwięków występujących w hiszpańskim słowie: ani zbliżonego do polskiego ch, lecz wymawianego bardziej „gardłowo”, oddawanego w pisowni przez j, ani r (inaczej niż we francuskim, gdzie w niektórych wariantach występuje r podobne do polskiego). Słowo oznaczające pietruszkę brzmi po haitańsku pegsil.

Zwłoki zamordowanych Haitańczyków wrzucono do rzeki, której francuska nazwa to Rivière Massacre (rzeka Masakra), nazwanej tak dla upamiętnienia dysputy granicznej jeszcze z czasów kolonialnych. Nomen omen…

W następnych odcinkach między innymi:

 

someone

O autorce

prof. dr hab. Jadwiga Linde-Usiekniewicz – kierownik Katedry Iberystyki, Wydziału Kulturoznawstwa i Filologii SWPS. Iberysta, językoznawca, specjalista w zakresie semantyki i pragmatyki kontrastywnej, struktur informacyjnych oraz relacji między semantyką, składnią a pragmatyką.

Przypisy

1R. Shuy, The Language of Murder Cases: Intentionality, Predisposition, and Voluntariness, Oxford 2014. str. 72.
2Tekst wg. Biblii Tysiąclecia.
3 J. Emerton, Studies on the Language and Literature of the Bible: Selected Works of J.A. Emerton, Lejda/ Boston 2014, str. 250-257.
4 https://sjp.pwn.pl/sjp/;2577347
5 https://www.salon24.pl/u/ryuuk/415193,soczewica-kolo-miele-mlyn-test-polskosci,soczewica-kolo-miele-mlyn-test-polskosci
6 http://www.notimerica.com/sociedad/noticia-masacre-perejil-exterminio-miles-haitianos-ordenado-trujillo-20161012081441.html
7 A. Richard, R. Govain, „Schibboleth, la langue comme arme de détection massive: 1937, le massacre des Haïtiens”, Lengas. Revue de Sociolinguistique 2016 (80), http://journals.openedition.org/lengas/1193
8 Tamże, przekład własny.

Cykl tematyczny: Sierpień 2020
Hasło miesiąca: Sztuczna inteligencja

Trudno zaprzeczyć, że zainteresowanie ideą tłumaczenia maszynowego od jakiegoś czasu wyraźnie wzrasta. Większość serwisów społecznościowych oferuje już możliwość automatycznego tłumaczenia wpisów. Strony internetowe coraz częściej korzystają z silników tłumaczenia maszynowego do udostępniania treści w różnych językach. Popularny google translate nie jest już tylko interesującym eksperymentem, na który spoglądamy z przymrużeniem oka. Teraz budzi grozę. Dla wielu jest zapowiedzią rychłego końca zawodu tłumacza. Jednak w rzeczywistości oba poglądy biorą się tylko i wyłącznie z niedostatecznej wiedzy, a jeśli rozwój tej technologii nie zostanie zahamowany, przyniesie znacznie więcej korzyści, niż strat. O technologiach w kontekście pracy tłumacza opowiada filolog anglista Marcin Szwed z Uniwersytetu SWPS.

Tłumaczenie automatyczne – eksperymentalne początki

Zacznijmy od tego, z czym w ogóle mamy do czynienia. Tzw. tłumaczenie maszynowe (ang. machine translation, MT) lub „tłumaczenie automatyczne”, jest dziedziną językoznawstwa komputerowego, czyli nauki zajmującej się takimi zagadnieniami, jak sztuczna inteligencja czy wykorzystanie korpusów językowych. Jest to więc nauka i jako taka opiera się na doświadczeniu i eksperymencie.

Pierwszym doświadczeniem, które – jak twierdzi wielu znawców tematu – zapoczątkowało obserwowany dziś gwałtowny rozwój technologii MT, był eksperyment przeprowadzony w Georgetown 7 stycznia 1954 roku, kiedy to eksperci z firmy IBM, wraz z naukowcami z Georgetown University, z powodzeniem uzyskali przekład ok. 60 zdań z języka rosyjskiego na język angielski za pomocą komputera. Maszyna, która została zaprzęgnięta do tego zadania, posiadała w swojej pamięci tylko 250 słów, a jej składnia robocza obejmowała zaledwie sześć reguł, według których ten skromny zasób słów był wykorzystywany do budowania zdań.

Reguły składni komputera z Georgetown także nie były przesadnie skomplikowane – oto ich pełny zestaw:

szwed tekst ryc1Źródło: W. Hutchins, The Georgetown-IBM experiment demonstrated in January 1954 (www.hutchinsweb.me.uk/AMTA-2004.pdf).

Pomimo tego, że zdania przeznaczone do tłumaczenia w ramach eksperymentu były starannie wyselekcjonowane, a samo tłumaczenie było oparte zasadniczo na podstawianiu jednostek leksykalnych, to eksperyment, o którym „The New York Times” napisał dzień później pod nagłówkiem „Szybki, elektroniczny tłumacz bez trudu przekłada rosyjski na angielski”, spowodował falę zainteresowania tłumaczeniem maszynowym, za którą poszły miliony dolarów na dalsze badania.

Rozwój metod tłumaczenia automatycznego

Nic zatem dziwnego, że od tamtego czasu technologia stojąca za tłumaczeniem automatycznym rozwinęła się w znacznym stopniu. W toku intensywnych badań wypracowano wiele różnych metod tłumaczenia maszynowego, jedną z których jest tzw. technologia tłumaczenia bezpośredniego, której przykładem był właśnie słynny eksperyment z Georgetown.

Oprócz tego znane są tzw. systemy przekładu składniowego oraz, stanowiące w pewnym sensie ich rozwinięcie, systemy powierzchniowego transferu semantycznego, których działanie opiera się na drzewie składników syntaktycznych, według którego algorytm programu podstawia odpowiednie elementy zdania do tekstu przekładu. Program wykorzystuje różne stopnie złożoności drzew syntaktycznych, w tym najprostsze:

szwed tekst ryc2 Źródło: https://linguistics.stackexchange.com/questions/19006/analyzing-negation-with-a-syntactic-tree.

Jak i nieco bardziej skomplikowane:

szwed tekst ryc3Źródło: https://tex.stackexchange.com/questions/111196/how-to-create-syntactic-trees-and-align-them-in-latex.

Oprócz tego istnieją także tzw. międzyjęzykowe systemy tłumaczenia automatycznego wykorzystujące uniwersalny język pośredni (tzw. interlingwa), gdzie tłumaczenie jest dwuetapowe i zaczyna się od przekładu z języka wyjściowego na wspomnianą interlingwę, a kończy na tłumaczeniu z interlingwy na język docelowy. Dalej mamy do czynienia z tzw. tłumaczeniem maszynowym opartym na przykładach, które wykorzystuje wcześniej przetłumaczone i podzielone na mniejsze fragmenty teksty, gdzie tłumaczenie jest tworzone na podstawie aproksymacji i podobieństwa do innych, wcześniej przetłumaczonych tekstów przechowywanych w specjalnej bazie danych. Najbardziej popularny i, jak się wydaje (przynajmniej do niedawna), zdecydowanie najbardziej skuteczny jest system tzw. tłumaczenia statystycznego oparty na modelach statystycznych tworzonych na podstawie analizy korpusu tekstów równoległych w danej parze językowej. System ten wykorzystuje następujący wzór:

szwed tekst ryc4

z którego wynika, że równie istotny, jak przechowywany w programie model języka P(e) jest zbiór danych wejściowych. Słowem, im więcej danych, tym lepsze działanie algorytmu systemu.

Żaden system nie działa jak ludzki mózg

Mechanizm tłumaczenia statystycznego leży u podstaw wspomnianego już, bardzo popularnego, programu google translate, który z tego powodu często nieprecyzyjnie jest określany jako system, który „sam się uczy”. Oczywiście jest to bardzo duże uproszczenie, ponieważ program ten wykonuje operacje statystyczne na wprowadzanym do niego materiale, czyli wykorzystuje zaawansowany rachunek prawdopodobieństwa, przy czym prawdopodobieństwo jest tu wprost proporcjonalne do ilości danych wejściowych (korpus dwujęzyczny). Mówiąc krótko – program niczego się nie „uczy”, chociaż faktycznie z czasem zdaje się działać coraz lepiej.

Warto jednak bardzo wyraźnie zaznaczyć, że żaden z wyżej wymienionych systemów MT nie działa w taki sposób, jak ludzki mózg. Są to jedynie różnego rodzaju zbiory mechanizmów i algorytmów, które w połączeniu ze sobą potrafią, w określonych sytuacjach i w określonym zakresie, doprowadzić do uzyskania zadowalających rezultatów. Na przykład maszynowe tłumaczenie symultaniczne mowy (w dzisiejszych czasach możliwe) to po prostu połączenie algorytmu rozpoznawania głosu z silnikiem tłumaczenia statystycznego (ze wszystkimi ograniczeniami, które niosą za sobą oba te mechanizmy). Oczywiście nie sposób nie wspomnieć w tym miejscu o bardzo głośnych w ostatnim czasie tzw. sztucznych sieciach neuronowych, jednak wydaje się, że przypisywanie im zdolności replikowania procesów zachodzących w mózgu człowieka jest nieco przesadzone i także wynika z nieznajomości zasad ich działania. Natomiast na jakąkolwiek miarodajną ocenę skuteczności silników MT opartych na SSN będziemy musieli jeszcze długo czekać.

Czy komputer zastąpi czy ułatwi pracę tłumaczy?

Wróćmy jednak do najważniejszej kwestii, czyli pytania o to, czy w najbliższej przyszłości są szanse na to, że komputer zastąpi tłumacza. Odpowiedź brzmi: to nie jest właściwe pytanie. Od kiedy zaczęliśmy korzystać z komputerowych edytorów tekstu, wiele zadań tradycyjnie wykonywanych ręcznie zostało scedowanych na naszego elektronicznego pomocnika. Komputer sprawdza za nas pisownię, poprawia formatowanie tekstu, rysuje tabele, umożliwia automatyczne wyszukiwanie, wstawianie i zastępowanie słów. Od kiedy mamy możliwość pracy z nowoczesnymi narzędziami OCR komputer rozpoznaje zeskanowane pismo lub druk i zamienia je na edytowalny tekst elektroniczny. Istnieją więc (i w rzeczy samej od dawna są już bardzo rozpowszechnione) narzędzia umożliwiające rozpoznawanie, a następnie wyszukiwanie i zastępowanie fragmentów tekstu dowolnej długości, jak również narzędzia sprawdzające pisownię i (do pewnego stopnia, chociaż postęp w tej dziedzinie także jest widoczny) gramatykę. W rezultacie przetłumaczenie dokumentu dostarczonego w druku lub w formie kiepskiej jakości skanu zajmuje dziś znacznie mniej czasu niż kilka, lub kilkanaście lat temu. Nie trzeba nikomu wyjaśniać, że bez komputerów i nowoczesnego oprogramowania nie byłoby to możliwe. Nikt też raczej nie zaprzeczy, że konwersja, formatowanie, sprawdzanie pisowni i przeszukiwanie tekstu to zadania, których tłumacze pozbyli się raczej chętnie. Nikt raczej nie chce wrócić do ręcznego przepisywania tekstu czy też mozolnego sprawdzania pisowni każdego pojedynczego słowa, o przeszukiwaniu długich dokumentów w poszukiwaniu wszystkich zastosowań danego terminu (np. w celu jego zastąpienia innym) nie wspominając.

To nie wszystko – pomyślmy o współczesnych narzędziach do tłumaczenia wspomaganego komputerowo. Jeden z podstawowych mechanizmów działania każdego programu CAT, czyli system pamięci tłumaczeniowych, to przecież nic innego, jak tłumaczenie maszynowe oparte na przykładach, o którym mówiliśmy wcześniej. Co więcej, stosowane w tych narzędziach bazy terminologiczne automatycznie podpowiadają nam terminy (tłumaczenie bezpośrednie), a mechanizmy typu „fragment assembly” próbują samodzielnie „składać” zdania na zasadzie przekładu składniowego, który także wymieniliśmy wcześniej jako kolejny z mechanizmów tłumaczenia maszynowego. Gdyby zapytać regularnego użytkownika programu CAT (a trzeba zaznaczyć, że coraz trudniej spotkać kogoś, kto tych narzędzi nie używa w ogóle), czy miałby ochotę przetłumaczyć np. sprawozdanie finansowe w formie tabelarycznej w programie MS Word, odpowiedź z pewnością byłaby przecząca.

W takim razie co się tak naprawdę dzieje? Wygląda na to, że na naszych oczach pisana jest historia zawodu tłumacza. Jesteśmy w stanie ją obserwować, ponieważ technologia rozwija się w niewiarygodnie szybkim (i stale rosnącym) tempie. Tłumacze pracujący w swoim zawodzie od 10 lub więcej lat pamiętają, jak komputery stopniowo przejmowały na siebie coraz więcej zadań. Ale czy zostali przez nie zastąpieni?

Wróćmy na chwilę do eksperymentu w Georgetown. Z perspektywy historycznej możemy dziś z całą pewnością powiedzieć, że euforia, która po nim nastąpiła, była przedwczesna. Czy to samo można stwierdzić teraz? Słowem – czy nadal prawdą jest, że automatyczne tłumaczenie dobrej jakości nadal pozostaje bardziej życzeniem, niż realnym celem do osiągnięcia w najbliższej przyszłości? Odpowiedź brzmi – to zależy. Mówiąc konkretniej – to zależy od tego, co uważamy za „tłumaczenie dobrej jakości”. Jeżeli maszynowy przekład kilkudziesięciu zdań na zasadzie tłumaczenia bezpośredniego, bez żadnej analizy relacyjnej w zakresie składni i z minimalnym zasobem leksykalnym w pamięci można było okrzyknąć tryumfem ówczesnej technologii, działanie dzisiejszych statystycznych silników MT podobnych do google translate z całą pewnością również powinno zostać uznane za sukces. Prawdziwym problemem tutaj nie jest jednak to, czy technologia jest w stanie wykonać swoją pracę, ale jak dobrze ta praca jest faktycznie wykonana i czy spełnia swoją funkcję do danego celu. Czy poprzednie zdanie pasuje do stylu całego artykułu? Zostało przetłumaczone z języka angielskiego najnowszą wersją google translate1. Doskonałym podsumowaniem tego problemu jest słynne retoryczne pytanie, które często pojawia się w kontekście skuteczności tłumaczenia maszynowego: „Is ‘good enough’ good enough?”

Jest na rynku miejsce zarówno na tłumaczenia automatyczne, jaki i na profesjonalne tłumaczenia

Podsumowując – rozwój komputerów i oprogramowania nie zagraża tłumaczom, ponieważ jego celem jest ułatwienie ich pracy. Natomiast tłumaczenie maszynowe to narzędzie, które spełnia określone zadanie i dla którego na pewno znajdzie się miejsce na rynku. Tego typu rozsądną politykę stosuje np. firma Microsoft, która niektóre teksty na swoich stronach internetowych, w tym informacje techniczne, instrukcje obsługi i teksty pomocy tłumaczy na języki obce maszynowo w oparciu na własnym, spersonalizowanym i stale rozwijanym silniku MT, ale np. tłumaczenie tekstów użytkowych, w tym umów, licencji, tekstów o charakterze reklamowym i promocyjnym itd. zleca tłumaczom (agencjom tłumaczeń). Oczywiście możliwe są na tym polu różne błędy i nadużycia. Dla przykładu, Urząd Patentowy RP nie zapewnia anglojęzycznej wersji swojej strony internetowej, zamiast tego stosując na niej tzw. wtyczkę do google translate. Takie działanie można uznać za błąd, ponieważ dostarczenie angielskich odpowiedników specjalistycznych słów i wyrażeń z dziedziny krajowego prawa własności intelektualnej, jak również tłumaczenia tekstów objaśniających różne zagadnienia z tej gałęzi prawa nie powinno być powierzane narzędziom MT, które w oczywisty sposób do tego celu się nie nadają (co, mam nadzieję, jest w tym momencie zupełnie jasne i nie będzie postrzegane jako próba subiektywnej oceny).

Powiedzmy to jeszcze raz: pytanie o to, czy komputer zastąpi tłumacza, jest nieprecyzyjne. Można powiedzieć nawet więcej: to nie jest to pytanie, które powinniśmy sobie teraz zadawać. Właściwe pytanie brzmi tak: skoro komputery coraz bardziej wyręczają tłumaczy, co trzeba zrobić, aby móc z tej pomocy korzystać? Tak naprawdę komputery zaczną zastępować tłumaczy tylko i wyłącznie wtedy, gdy tłumacze będą je ignorować. Z wyjątkiem nielicznych i bardzo specjalistycznych sektorów rynku przekładu (np. tłumaczenie tekstów literackich lub, do pewnego stopnia, akademickich), bardzo trudno jest dziś znaleźć pracę w tym zawodzie bez przynajmniej podstawowej znajomości jednego programu CAT i narzędzia OCR, o umiejętności korzystania z edytora tekstu i arkuszy kalkulacyjnych nie wspominając. Technologia to ekspres, który będzie dalej pędzić naprzód bez względu na to, czy będziemy na jego pokładzie. Postarajmy się więc jak najszybciej o bilet. Najlepiej przy oknie.

 

swed

O autorze

Marcin Szwed – filolog anglista, czynny tłumacz LSP, tłumacz ustny i dydaktyk przekładu, prowadzi warsztaty z zakresu tłumaczenia tekstów specjalistycznych i tłumaczenia konferencyjnego, wykładowca Uniwersytetu SWPS i Uniwersytetu Warszawskiego, tłumacz przysięgły języka angielskiego od 2006 r. specjalizujący się w dziedzinach prawa (w tym prawa UE), techniki budowlanej i farmacji.

 

Przypis

1The real problem here is not, however, whether technology is able to do its job, but how good that job is actually done and if it fulfils its function for the given purpose.

Producenci serialu „Wikingowie”, który nie tak dawno temu zdobył popularność wśród widzów na całym świecie, nie ukrywali, że związek filmowej fabuły z historią jest dość luźny. I nie dotyczyło to jedynie tego, że główny bohater, Ragnar Loðbrók, nie był postacią autentyczną, a legendarnym władcą opisywanym w sagach. Stroje i broń z epoki, ale i sceneria poszczególnych miejsc, odtworzone zostały w sposób bardziej malowniczy niż wierny. Trudno zresztą o autentyzm, skoro historia przedstawiona w serialu stanowi kompilację wydarzeń z niemal stu lat.

Czy Ragnar Loðbrók musiał się uczyć angielskiego?

Kwestią, do której – jak się zdaje – producenci podeszli skrupulatniej, był język: w przeważającej części serialu słyszymy angielski, jednak w kilku scenach przedstawiających konfrontację Anglosasów z Wikingami, by zamarkować różnice językowe, pojawiają się staroangielski oraz staronordycki. O napisanie dialogów poproszono mediewistyczne ekspertki: dr Kate Wiles z Uniwersytetu w Leeds oraz dr Erikę Sigurdson z Uniwersytetu Islandzkiego.

W każdym z tych epizodów bohaterowie nie rozumieją się i muszą korzystać z pomocy tłumacza – czasem jest nim Athelstan, angielski mnich wzięty do niewoli, który (czego dowiadujemy się z drugiego odcinka) zna język nordycki, ponieważ podróżował po świecie. Później tłumaczy także sam Ragnar, który z pomocą Athelstana nauczył się angielskiego. Widzimy to choćby w trzecim odcinku pierwszego sezonu, kiedy to drużyna Wikingów na głos snuje mało przyjazne zamiary, zaś stojący naprzeciwko nich Anglosasi, niczego nie pojmując, oferują im pokój. Jednak czy rzeczywiście użytkownicy staroangielskiego i staronordyckiego – języków wywodzących się z tej samej rodziny – nie rozumieli się nawzajem? Innymi słowy, czy Ragnar musiał uczyć się języka Athelstana, by móc rozmawiać ze swoimi przeciwnikami? I czy językoznawcy są w stanie odpowiedzieć na to pytanie, skoro mowa o językach używanych przed ponad dziesięcioma wiekami? Z jakich źródeł mogą skorzystać, próbując wyjaśnić taką zagwozdkę?

Wraz z nasilającym się osadnictwem wikińskim kontakty staronordyckiego ze staroangielskim musiały się zintensyfikować. Jak zatem komunikowali się ze sobą przedstawiciele obu grup? Czy potrzebowali tłumaczy, czy też sami uczyli się drugiego języka? A może rozumieli się wzajemnie, mimo że każdy mówił po swojemu, ponieważ jak już wspomniano – język staroangielski i staronordycki miały wspólnego przodka?

Co współczesne językoznawstwo może powiedzieć o spotkaniach Wikingów z Anglosasami?

Zacznijmy od początku – nie serialowego a historycznego – czyli od pierwszego udokumentowanego wrogiego kontaktu między Anglosasami a mieszkańcami Północy. W „Kronice anglosaskiej” – skrupulatnie spisywanej przez mnichów z Wesseks od około końca IX w., ale zawierającej także dokładne wyliczenie wcześniejszych zdarzeń – we wpisie na rok 787 pojawia się następująca relacja:

Her nam Berhtric cyning Offan dohter Eadburge. on his dagum comon ærest .iii. scypu Norðmanna of Hæreðalande, þa sæ gerefa þærto rad, hie wolde drifan to þæs cyninges tune þe he nyste hwæt hi wæron, hine man ofsloh þa. Ðæt wæron þa ærestan scipu Dæniscra manna þe on Engelcynnes land gesohton. („Kronika anglosaska”, Manuskrypt D)1.

W tym roku Berhtric wziął córkę króla Offy Eadburgę za żonę. Za jego dni przybyły trzy pierwsze statki Skandynawów z Hordaland, wtedy szeryf pojechał tam i chciał ich zabrać do miasta króla, bo nie wiedział, kim są, a oni go wówczas zabili. To były pierwsze statki Duńczyków, które nawiedziły ziemię angielskiego ludu2.

Nie wiadomo, czy szeryf zdążył porozmawiać z najeźdźcami (swoją drogą warto zaznaczyć, że „Duńczycy” nie oznaczają tu tylko mieszkańców Danii, a przybyszy z Północy w ogóle). Kolejna wzmianka, nieco bardziej dramatyczna, dotyczy większego ataku na klasztor na wyspie Lindisfarne w roku 793:

793. Her wæron reðe forebecna cumene ofer Norðhymbra land, þæt folc earmlic bregdon, þæt wæron ormete þodenas ligrescas, fyrenne dracan wæron gesewene on þam lifte fleogende. Þam tacnum sona fyligde mycel hunger, litel æfter þam, þæs ilcan geares on .vi. Idus Ianuarii, earmlice hæþenra manna hergunc adilegode Godes cyrican in Lindisfarnaee þurh hreaflac mansliht. („Kronika anglosaska”, Manuskrypt D)

faksymilie

Faksymile „Kroniki anglosaskiej”, wpis z r. 793:, źródło: http://www.bl.uk/manuscripts/Viewer.aspx?ref=cotton_ms_tiberius_b_iv_f003r

793. Tego roku nad ziemią Nortumbryjczyków pojawiły się straszne znaki, które okrutnie przeraziły lud. Były to ściany światła mknące w powietrzu oraz serpentyny, ognie, smoki latające na nieboskłonie. Po tych przejmujących zwiastunach wkrótce nastąpił straszny głód; a niedługo potem, szóstego dnia przed idami styczniowymi tego roku, najazd pogan strasznie splądrował kościół na Lindisfarne poprzez grabież i mord.

Właśnie to wydarzenie uznawane jest za początek epoki wikińskich najazdów; sam opis stał się zresztą inspiracją jednej z początkowych scen serialu „Wikingowie”. W następnych latach na Wyspy Brytyjskie nadpłynęły kolejne hæðene heras – pogańskie armie z Północy. W drugiej połowie dziewiątego wieku Wikingowie nadciągnęli w większej sile (pod przywództwem Ivara bez kości oraz Halfdana, którzy ponoć byli synami legendarnego Ragnara) i zaczęli osadzać się na ziemiach anglosaskich, a wkrótce przejęli wpływy nad sporą częścią Wielkiej Brytanii, tworząc tak zwane Danelaw – teren, na którym obowiązywała jurysdykcja duńska, potwierdzona paktem zawartym w roku 878 z angielskim królem Alfredem Wielkim.

Wraz z nasilającym się osadnictwem wikińskim kontakty staronordyckiego ze staroangielskim musiały się zintensyfikować. Jak zatem komunikowali się ze sobą przedstawiciele obu grup? Czy potrzebowali tłumaczy, czy też sami uczyli się drugiego języka? A może rozumieli się wzajemnie, mimo że każdy mówił po swojemu, ponieważ jak już wspomniano – język staroangielski i staronordycki miały wspólnego przodka? Oba języki pochodzą od pragermańskiego, którym mówiły ludy zamieszkujące tereny dzisiejszych północnych Niemiec i południowej Skandynawii, a który dzielił się na odłam północny, wschodni i zachodniogermański.

Kres wspólnocie germańskiej położył okres migracji, który rozpoczął się około IV w.n.e, kiedy to część plemion mówiących zachodniogermańskim głównie Anglowie i Sasi – przewędrowali na Wyspy Brytyjskie. To z ich języka wywodzi się angielski, natomiast z północnogermańskiego narodził się nordycki, z którego potem, około XIII lub XIV wieku, swój początek wzięły języki skandynawskie. Można zatem przyjąć, że skoro do czasów najazdów wikińskich w VIII wieku mieszkańcy Anglii nie kontaktowali się regularnie ze Skandynawami (a wskazują na to źródła i znaleziska archeologiczne), te dwie odmiany germańskiego – angielski i nordycki – były od siebie odizolowane przez około cztery stulecia.

Stan współczesnych badań

Jak zatem można dojść do tego, czy Anglosasi i Wikingowie się rozumieli? Językoznawstwo postanowiło sobie odpowiedzieć na to pytanie, korzystając z wyników współczesnych badań dotyczących sytuacji kontaktu językowego, które przeprowadzono m.in. na imigrantach w USA. Uznano bowiem, że przed wiekami użytkownicy jednego języka, sąsiadując z użytkownikami innego języka, zapewne wykazywali podobne zachowania, z jakimi mamy do czynienia dziś. Prowadzenie tego typu analiz w duchu socjolingwistyki - działu językoznawstwa, który zajmuje się związkiem między językiem a jego kontekstem społecznym - opiera się na czterech podstawowych metodach:

  1. przebadaniu respondentów pod kątem stopnia rozumienia teksów i nagrań innego języka/ dialektu (dowód empiryczny)
  2. wywiadach z respondentami (dowód anegdotyczny)
  3. przeprowadzeniu analizy porównawczej języków (dowód filologiczny) 
  4. zbadaniu relacji między użytkownikami badanych języków (dowód społeczny)3.

Jak jednak przeprowadzić badanie tego rodzaju, skoro mówimy o użytkownikach, którzy żyli ponad tysiąc lat temu? Z doniesień Matthew Townenda4, autora monografii poświęconej anglo-nordyckim relacjom, wbrew pozorom nie jest to niewykonalne. Co do pierwszej metody, zamiast klasycznych testów zbadano np. zapisane w różnego rodzaju źródłach nazwy miejscowości. Okazało się, że nierzadko Wikingowie, przejmując tę czy inną osadę od Anglosasów, zmieniali nazwę, tłumacząc angielskie słowa na nordycki, co sugeruje, że musieli je rozumieć (np. Shipton, gdzie ship oznacza ’statek’, zaś ton ’miasto’, zmieniono na Skipton, gdzie skip to nordycki odpowiednik ship). Anglosasi, przejmując wikińskie osady, robili podobnie. Co więcej, pożyczali nordyckie wyrazy, łącząc je z rodzimymi i w ten sposób tworząc nowe nazwy. Jeśli natomiast chodzi o wywiady, sięgnięto do kronik i utworów literackich, szukając w nich potwierdzenia ewentualnego zrozumienia lub jego braku. I tak, na przykład, w islandzkiej „Gunnlaugs saga ormstungu” spisanej w XIII wieku, ale opowiadającej historię z przełomu dziesiątego i jedenastego wieku, znaleziono następujący fragment:

Ein var þá tunga á Englandi sem í Nóregi ok í Danmörku. En þá skiptust tungur í Englandi, er Vilhjálmr bastarðr vann England. Gekk þaðan af í Englandi valska, er hann var þaðan ættaðr. (Gunnlaugs saga ormstungu, Rozdział 7)

Jednaki był w ten czas język w Anglii, jak i w Norwegii i Danii. Ale język w Anglii zmienił się, kiedy kraj podbił William Bękart. Od tego czasu bowiem w Anglii mówiono po francusku, jako że był on z Francji5.

Podobny przekaz znajdujemy w islandzkim „Pierwszym traktacie o gramatyce” z XII w., gdzie pojawia się następująca wzmianka o Anglikach:

…alls vé e um einna tungu, þó at gǫ zk hafi mjǫk…

(…) mamy jeden język, choć jeden [z tych dwóch języków] zmienił się bardzo (…) („Pierwszy traktat o gramatyce” l. 12)6

Powyższych źródeł literackich nie można wprawdzie traktować dosłownie, ponieważ zostały spisane, kiedy już epoka wikińska w Anglii dobiegła końca. Stanowią jednak ważną wskazówkę potwierdzającą, że w kulturze zachowała się pamięć o tym, że użytkownicy obu języków byli świadomi podobieństw między nimi.

Trzecia metoda – lingwistyczna analiza porównawcza nastręcza mniejszych problemów. Można bowiem porównać angielskie i nordyckie wyrazy, zestawiając je dodatkowo z formami języka pragermańskiego, które odtworzono na podstawie rekonstrukcji historycznej (opartej na pewnych regularnościach w zmianie językowej). Porównania takie pokazują, że mimo pewnych - czasami dość daleko posuniętych zmian w wymowie i gramatyce, na poziomie leksykalnym języki wykazywały nadal sporo podobieństw, co widać choćby w poniższych przykładach7:

 

staroang. staronord. znaczenie
dæg dagr dzień
ræd ráð rada
bān bein kość
hlēapan hlaupa rzucać się
fēower fjórir cztery

 

Ostatnia z metod, zbadanie relacji społecznych obu grup, w przypadku Wikingów i Anglosasów również nie nastręcza trudności, zachowało się bowiem wiele tekstów potwierdzających wszelkiego rodzaju prawne ustalenia dotyczące, na przykład, płacenia trybutu (za czasów częstych konfliktów) czy (później) przejmowania ziem i odkupywania skradzionych dóbr itp. Dodatkowo intensywne kontakty – m.in. handlowe – oraz wzajemne wpływy potwierdzają różnego rodzaju znaleziska archeologiczne. Jest to o tyle istotne, że związek między zrozumieniem języka a relacjami społecznymi jest obustronny, tzn. nie jest tak, że zrozumienie jest warunkiem nawiązania takich relacji, ale że relacje na różnym poziomie skłaniają do wypracowania strategii, które wspomagają zrozumienie (użytkownicy starają się dostosować swój język do rozmówcy, bowiem w ich interesie jest obopólne porozumienie).

Na co zatem wskazują wyniki badań nad anglo-nordyckim zrozumieniem? Na pewno nie można przyjąć za „oczywiste”, że Wikingowie najeżdżający Wyspy w VIII czy IX wieku, „bez problemu” rozumieli Anglosasów, językoznawstwo historyczne musi bowiem być ostrożne w swoich twierdzeniach. Można jednak założyć (głównie na podstawie porównawczej analizy językowej), że poziom zrozumienia miął szansę być spory. Dodatkowo, dowody zgromadzone na poziomie empirycznym, anegdotycznym i społecznym wskazują na to, że wraz z rozwojem osadnictwa wikińskiego w Anglii, użytkownicy obu języków najpewniej wypracowali strategie, które mogły zwiększyć zrozumienie nordycko-angielskie. Potwierdzeniem zbliżenia się obu języków jest zresztą silny wpływ skandynawski na słownictwo angielskie; do codziennej angielszczyzny przeniknęło bowiem mnóstwo wyrazów o nordyckich korzeniach, jak choćby te zaznaczone w następującym zdaniu:

By mistake her husband gave their sick kids some cake.

Wracając do pytania postawionego w tytule, można zatem uznać, że Ragnar nie musiał się specjalnie uczyć języka swoich anglosaskich przeciwników, choć z początku mógł mieć pewne problemy ze zrozumieniem ich. Natomiast jego potomkowie, którzy – według podań na Wyspach zabawili dłużej, takich problemów mieli prawdopodobnie o wiele mniej.

Fragment serialu „Wikingowie”, odcinek 1, reż. Ciaran Donnelly,  źródło: https://www.youtube.com/watch?v=CWVyqMCCgeY

 

258 mklos

O autorce

dr Małgorzata Kłos – anglistka i skandynawistka, tłumaczka. Naukowo zajmuje się przede wszystkim językoznawstwem historycznym, semantyką i leksyką oraz szeroko rozumianymi zależnościami między językiem i kulturą, w tym zwłaszcza kwestią tabuizacji i eufemizacji. Tłumaczy literaturę szwedzką, w tym m.in powieści Håkana Nessera. Na Uniwersytecie SWPS pełni funkcję p.o kierownika Katedry. Prowadzi zajęcia z gramatyki praktycznej, pisania i przekładu, tendencji rozwojowych języków skandynawskich.

Przypisy

1 Fragmenty z Kroniki anglosaskiej (Manuskrypt D), http://asc.jebbo.co.uk/d/d-L.html [dostęp 20.01.2018].
2 Tłumaczenia własne za The Anglo-Saxon Chronicles. Translated and edited by Michael Swanton, red. i tłum. M. Swanton, Phoenix Press, Londyn 2000, str. 54, 56.
3 M. Townend, Language and History in Viking Age England. Linguistic Relations between Speakers of Old Norse and Old English, Brepols, Turnhout, 2002, str. 13.
4 Tamże.
5 Fragment i tłumaczenie własne za M. Townend, op. cit., str. 16.
6 Fragment i tłumaczenie własne za The First Grammatical Treatise. Introduction. Text. Notes. Translation. Vocabulary. Facsimiles, red. i tłum. H. Benediktsson, Institute of Nordic Linguistics, Rejkjavik, 1972, str. 209.
7 Przykłady z E. M. Gay, Old English and Old Norse: an Inquiry into Intelligibility and Categorization Methodology, 2014, http://scholarcommons.sc.edu/etd/2604 [dostęp 19.01.2018], str. 20.

Serial „Manhunt: Unabomber”, dostępny w Polsce na platformie Netflix, to oparta na faktach historia poszukiwania jednego z najsłynniejszych amerykańskich terrorystów ubiegłego wieku. Głównym bohaterem serialu jest James Fitzgerald, postać autentyczna, profiler FBI, który doprowadza do zidentyfikowania terrorysty i jego aresztowania, a to wszystko dzięki stosowanej przez siebie technice „profilowania lingwistycznego”, która stała się częścią intensywnie rozwijanej w USA „lingwistyki kryminalistycznej”. W czwartym z pięciu artykułów poświęconych detektywistycznym aspektom językoznawstwa prof. dr hab. Jadwiga Linde-Usiekniewicz z Uniwersytetu SWPS opowie o znaczeniu profilowania lingwistycznego na długo przed pojawieniem się lingwistyki jako dziedziny nauki.

Profil lingwistyczny, ustalenie autorstwa, „prace niesamodzielne” i plagiaty

Opisany w poprzednim odcinku profil lingwistyczny Unabombera, oparty na listach do gazet i manifeście „Industrial Society and Its Future” pozwolił określić pewne cechy demograficzne autora, ale nie jego tożsamość. Nikt też nie rozpoznał w autorze swojego dawnego studenta. FBI uznało – i tu najprawdopodobniej zasadniczą rolę odegrał James Fitzgerald – iż należy opublikować tekst (czego zresztą Unabomber się domagał) w nadziei, że ktoś rozpozna sposób pisania i styl autora (technicznie mówiąc: jego idiolekt).

Tak się też stało i David Kaczynski rozpoznał w tekście cechy charakterystyczne dla sposobu pisania swojego starszego brata Teda. Dostarczył FBI inne teksty autorstwa Teda Kaczynskiego. Teraz chodziło o wykazanie, że zbieżności nie są przypadkowe i że autorem może być jedna i ta sama osoba. Między tekstami Unabombera a tekstami niewątpliwie autorstwa Teda Kaczyńskiego FBI znalazło 500 lub 600 podobieństw – zarówno ortograficznych, jak i w zakresie użycia pewnych wyrażeń i zwrotów. Grupą agentów i być może agentek FBI, którym powierzono to zadanie, kierował James Fitzgerald.

Zadaniem tej grupy nie było udowodnienie ponad wszelką wątpliwość, iż Kaczynski jest Unabomberem. Chodziło wyłącznie o to, by wykazać, że zachodzi tzw. uzasadnione podejrzenie (ang. probable cause), iż tak jest, i uzyskać nakaz przeszukania chatki Teda Kaczynskiego w Montanie. Nakaz taki w amerykańskim systemie prawnym wystawić może jedynie sędzia, co więcej, na mocy Czwartej Poprawki do Konstytucji nie wolno przeszukać czyjegoś mieszkania bez takiego nakazu. Sędziowie zawsze muszą się zatem liczyć z tym, że o każdej porze dnia i nocy policja albo FBI zwrócą się do nich z odpowiednim wnioskiem.

W filmie sędzia wydaje nakaz, mimo wątpliwości formalno-prawnych, gdyż przypomina sobie wspomniane w trzecim artykule serii o profilowaniu lingwistycznym stosowane przez Amerykanów na Pacyfiku hasła pozwalające odróżnić swoich od Japończyków i sytuację, kiedy sam rozpoznał wroga, który zamiast liberty powiedział riberty. Przeszukanie chatki dostarczyło materialnych dowodów na to, iż Ted Kaczyński to Unabomber. Do procesu nie doszło, gdyż Kaczyński poszedł na ugodę i przyznał się do winy w zamian za to, że prokurator nie żądał kary śmierci a jedynie dożywocia.

W opowiedzianej w filmie historii, tak jak i w jej prawdziwej wersji, nie chodziło o to, by udowodnić na podstawie podobieństwa tekstów, iż Ted Kaczyński to Unabomber, a jedynie by wykazać wysokie prawdopodobieństwo tego faktu. Porównywano też dwa zestawy tekstów: teksty Unabombera i niewątpliwe teksty Kaczyńskiego. Inaczej jest w przypadku, gdy badacze, najczęściej historycy literatury, chcą dowiedzieć się, kto może być autorem konkretnego tekstu.

Jednym z pierwszych badaczy, stosujących metody ilościowe do badań filologicznych, był Wincenty Lutosławski, twórca terminu stylometria jako nazwy tej metody czy też dziedziny badań. Zakłada się w nich między innymi, że istnieje coś takiego jak „stylistyczny odcisk palca” – pewne cechy stylu autorskiego, niekontrolowane przez samego autora i pozwalające z dużym prawdopodobieństwem ustalić na przykład, kim naprawdę jest nowy, nieznany autor, zwłaszcza jeżeli zachodzi podejrzenie, że nie jest to debiutant lub debiutantka, kto ze znanych autorów może kryć się za pseudonimem.

Badania takie mają wielowiekową tradycję, ale już pod koniec XIX wieku pojawiły się metody nowe, oparte na pewnych własnościach tekstów dających się policzyć1. Jednym z pierwszych badaczy, stosujących metody ilościowe do badań filologicznych, był Wincenty Lutosławski, twórca terminu stylometria jako nazwy tej metody czy też dziedziny badań2. Zakłada się w niej między innymi, że istnieje coś takiego jak „stylistyczny odcisk palca” – pewne cechy stylu autorskiego, niekontrolowane przez samego autora i pozwalające z dużym prawdopodobieństwem ustalić na przykład, kim naprawdę jest nowy, nieznany autor, a jeżeli zachodzi podejrzenie, że nie jest to debiutant lub debiutantka, kto ze znanych autorów może kryć się za pseudonimem. W ostatnich czasach w ten sposób usiłowano ustalić, kim jest Robert Galbraith, autor powieści „Wołanie kukułki” – okazało się, że jest nim J. J. Rowling, autorka cyklu o Harrym Potterze. Inną tajemniczą postacią jest Elena Ferrante – być może za tym pseudonimem kryje się włoski pisarz Domenico Starnone, być może tłumaczka Anita Raja, a być może oboje3.

Metody stylometryczne obejmują porównywanie częstości słów najczęściej występujących, niezależnie od ich charakteru, tj. należących do wszystkich części mowy, albo tylko tzw. wyrazów funkcyjnych, czyli przyimków, spójników, zaimków, a w języku angielskim, francuskim czy niemieckim także rodzajników. I tak wyrazy funkcyjne mają w tekstach stosunkowo wysoką frekwencję, zwykle wyższą niż słowa pełnoznaczne. Czasami bada się także frekwencję nie pojedynczych słów, ale ich połączeń: par wyrazów, trójek wyrazów, itd. Można też badać analogiczne sekwencje literowe.

„Stylometryczny odcisk palca” pozwala postawić hipotezy na temat autorstwa z dużym prawdopodobieństwem. Wymaga jednak odpowiednio dużej próbki tekstu i nie jest tak jednoznacznym dowodem, jak prawdziwy odcisk palca, wzór siatkówki czy DNA.

Czasami jednak nie potrzeba tak wyszukanych narzędzi. Wynikiem intuicyjnie przeprowadzonej analizy stylometrycznej jest na przykład zarzut nauczyciela, że przygotowana w domu praca jest „niesamodzielna” – najczęściej pojawia się w niej zbyt erudycyjne słownictwo, zbyt wyszukana składnia, a być może i treść jest zbyt erudycyjna…. Wszystko to odstaje od stylu prac klasowych. Na podobnej zasadzie – tekst zbyt poprawny, zbyt staranny, zbyt erudycyjny w porównaniu z wcześniejszymi pracami autora może zostać wstępnie uznany za plagiat.

W następnym odcinku:

  • Co wspólnego ma praojczyzna Słowian z poszukiwaniem Unabombera?

 

someone

O autorce

prof. dr hab. Jadwiga Linde-Usiekniewicz – kierownik Katedry Iberystyki, Wydziału Kulturoznawstwa i Filologii SWPS. Iberysta, językoznawca, specjalista w zakresie semantyki i pragmatyki kontrastywnej, struktur informacyjnych oraz relacji między semantyką, składnią a pragmatyką.

Przypisy

1 M. Eder. “Style-Markers in Authorship Attribution A Cross-Language Study of the Authorial Fingerprint”, Studies in Polish Linguistics 2011, 6, str. 100.
2 Tamże.
http://biqdata.wyborcza.pl/biqdata/7,159116,22829674,jak-rozpracowano-elene-ferrante-slowo-po-slowie.html

 

kanały

zobacz też

strefa psyche strefa designu strefa zarzadzania strefa prawa logo