logo

logo uswps nazwa 3

Język

Profil lingwistyczny a ustalanie autorstwa

Serial „Manhunt: Unabomber”, dostępny w Polsce na platformie Netflix, to oparta na faktach historia poszukiwania jednego z najsłynniejszych amerykańskich terrorystów ubiegłego wieku. Głównym bohaterem serialu jest James Fitzgerald, postać autentyczna, profiler FBI, który doprowadza do zidentyfikowania terrorysty i jego aresztowania, a to wszystko dzięki stosowanej przez siebie technice „profilowania lingwistycznego”, która stała się częścią intensywnie rozwijanej w USA „lingwistyki kryminalistycznej”. W czwartym z pięciu artykułów poświęconych detektywistycznym aspektom językoznawstwa prof. dr hab. Jadwiga Linde-UsiekniewiczUniwersytetu SWPS opowie o znaczeniu profilowania lingwistycznego na długo przed pojawieniem się lingwistyki jako dziedziny nauki.

Profil lingwistyczny, ustalenie autorstwa, „prace niesamodzielne” i plagiaty

Opisany w poprzednim odcinku profil lingwistyczny Unabombera, oparty na listach do gazet i manifeście „Industrial Society and Its Future” pozwolił określić pewne cechy demograficzne autora, ale nie jego tożsamość. Nikt też nie rozpoznał w autorze swojego dawnego studenta. FBI uznało – i tu najprawdopodobniej zasadniczą rolę odegrał James Fitzgerald – iż należy opublikować tekst (czego zresztą Unabomber się domagał) w nadziei, że ktoś rozpozna sposób pisania i styl autora (technicznie mówiąc: jego idiolekt).

Tak się też stało i David Kaczynski rozpoznał w tekście cechy charakterystyczne dla sposobu pisania swojego starszego brata Teda. Dostarczył FBI inne teksty autorstwa Teda Kaczynskiego. Teraz chodziło o wykazanie, że zbieżności nie są przypadkowe i że autorem może być jedna i ta sama osoba. Między tekstami Unabombera a tekstami niewątpliwie autorstwa Teda Kaczyńskiego FBI znalazło 500 lub 600 podobieństw – zarówno ortograficznych, jak i w zakresie użycia pewnych wyrażeń i zwrotów. Grupą agentów i być może agentek FBI, którym powierzono to zadanie, kierował James Fitzgerald.

Zadaniem tej grupy nie było udowodnienie ponad wszelką wątpliwość, iż Kaczynski jest Unabomberem. Chodziło wyłącznie o to, by wykazać, że zachodzi tzw. uzasadnione podejrzenie (ang. probable cause), iż tak jest, i uzyskać nakaz przeszukania chatki Teda Kaczynskiego w Montanie. Nakaz taki w amerykańskim systemie prawnym wystawić może jedynie sędzia, co więcej, na mocy Czwartej Poprawki do Konstytucji nie wolno przeszukać czyjegoś mieszkania bez takiego nakazu. Sędziowie zawsze muszą się zatem liczyć z tym, że o każdej porze dnia i nocy policja albo FBI zwrócą się do nich z odpowiednim wnioskiem.

W filmie sędzia wydaje nakaz, mimo wątpliwości formalno-prawnych, gdyż przypomina sobie wspomniane w trzecim artykule serii o profilowaniu lingwistycznym stosowane przez Amerykanów na Pacyfiku hasła pozwalające odróżnić swoich od Japończyków i sytuację, kiedy sam rozpoznał wroga, który zamiast liberty powiedział riberty. Przeszukanie chatki dostarczyło materialnych dowodów na to, iż Ted Kaczyński to Unabomber. Do procesu nie doszło, gdyż Kaczyński poszedł na ugodę i przyznał się do winy w zamian za to, że prokurator nie żądał kary śmierci a jedynie dożywocia.

W opowiedzianej w filmie historii, tak jak i w jej prawdziwej wersji, nie chodziło o to, by udowodnić na podstawie podobieństwa tekstów, iż Ted Kaczyński to Unabomber, a jedynie by wykazać wysokie prawdopodobieństwo tego faktu. Porównywano też dwa zestawy tekstów: teksty Unabombera i niewątpliwe teksty Kaczyńskiego. Inaczej jest w przypadku, gdy badacze, najczęściej historycy literatury, chcą dowiedzieć się, kto może być autorem konkretnego tekstu.

Jednym z pierwszych badaczy, stosujących metody ilościowe do badań filologicznych, był Wincenty Lutosławski, twórca terminu stylometria jako nazwy tej metody czy też dziedziny badań. Zakłada się w nich między innymi, że istnieje coś takiego jak „stylistyczny odcisk palca” – pewne cechy stylu autorskiego, niekontrolowane przez samego autora i pozwalające z dużym prawdopodobieństwem ustalić na przykład, kim naprawdę jest nowy, nieznany autor, zwłaszcza jeżeli zachodzi podejrzenie, że nie jest to debiutant lub debiutantka, kto ze znanych autorów może kryć się za pseudonimem.

Badania takie mają wielowiekową tradycję, ale już pod koniec XIX wieku pojawiły się metody nowe, oparte na pewnych własnościach tekstów dających się policzyć1. Jednym z pierwszych badaczy, stosujących metody ilościowe do badań filologicznych, był Wincenty Lutosławski, twórca terminu stylometria jako nazwy tej metody czy też dziedziny badań2. Zakłada się w niej między innymi, że istnieje coś takiego jak „stylistyczny odcisk palca” – pewne cechy stylu autorskiego, niekontrolowane przez samego autora i pozwalające z dużym prawdopodobieństwem ustalić na przykład, kim naprawdę jest nowy, nieznany autor, a jeżeli zachodzi podejrzenie, że nie jest to debiutant lub debiutantka, kto ze znanych autorów może kryć się za pseudonimem. W ostatnich czasach w ten sposób usiłowano ustalić, kim jest Robert Galbraith, autor powieści „Wołanie kukułki” – okazało się, że jest nim J. J. Rowling, autorka cyklu o Harrym Potterze. Inną tajemniczą postacią jest Elena Ferrante – być może za tym pseudonimem kryje się włoski pisarz Domenico Starnone, być może tłumaczka Anita Raja, a być może oboje3.

Metody stylometryczne obejmują porównywanie częstości słów najczęściej występujących, niezależnie od ich charakteru, tj. należących do wszystkich części mowy, albo tylko tzw. wyrazów funkcyjnych, czyli przyimków, spójników, zaimków, a w języku angielskim, francuskim czy niemieckim także rodzajników. I tak wyrazy funkcyjne mają w tekstach stosunkowo wysoką frekwencję, zwykle wyższą niż słowa pełnoznaczne. Czasami bada się także frekwencję nie pojedynczych słów, ale ich połączeń: par wyrazów, trójek wyrazów, itd. Można też badać analogiczne sekwencje literowe.

„Stylometryczny odcisk palca” pozwala postawić hipotezy na temat autorstwa z dużym prawdopodobieństwem. Wymaga jednak odpowiednio dużej próbki tekstu i nie jest tak jednoznacznym dowodem, jak prawdziwy odcisk palca, wzór siatkówki czy DNA.

Czasami jednak nie potrzeba tak wyszukanych narzędzi. Wynikiem intuicyjnie przeprowadzonej analizy stylometrycznej jest na przykład zarzut nauczyciela, że przygotowana w domu praca jest „niesamodzielna” – najczęściej pojawia się w niej zbyt erudycyjne słownictwo, zbyt wyszukana składnia, a być może i treść jest zbyt erudycyjna…. Wszystko to odstaje od stylu prac klasowych. Na podobnej zasadzie – tekst zbyt poprawny, zbyt staranny, zbyt erudycyjny w porównaniu z wcześniejszymi pracami autora może zostać wstępnie uznany za plagiat.

W następnym odcinku:

  • Co wspólnego ma praojczyzna Słowian z poszukiwaniem Unabombera?

 

someone

O autorce

prof. dr hab. Jadwiga Linde-Usiekniewicz – kierownik Katedry Iberystyki, Wydziału Kulturoznawstwa i Filologii SWPS. Iberysta, językoznawca, specjalista w zakresie semantyki i pragmatyki kontrastywnej, struktur informacyjnych oraz relacji między semantyką, składnią a pragmatyką.

Przypisy

1 M. Eder. “Style-Markers in Authorship Attribution A Cross-Language Study of the Authorial Fingerprint”, Studies in Polish Linguistics 2011, 6, str. 100.
2 Tamże.
http://biqdata.wyborcza.pl/biqdata/7,159116,22829674,jak-rozpracowano-elene-ferrante-slowo-po-slowie.html

podobne artykuły

Różnice w komunikacji kobiet i mężczyzn

in Ludzie

by Karina Stasiuk-Krajewska

W jakim celu rozmawiają kobiety, a w jakim mężczyźni? Kto jest lepszym słuchaczem? Czy to…

Język memów a rozwój w dobie internetów

in Język

by Marta Nizio - Redakcja

W jednym z odcinków słynnych „Przyjaciół” Chandler Bing, aby uwolnić się od nałogu tytoniowego, w…

Co z tą Szwecją?

in Kultura

by Gabriel Stille

9 września w Szwecji odbędą się wybory parlamentarne. Zapewne z tego powodu kraj znów znajdzie…

kanały

zobacz też