Nauka dla Społeczeństwa

23.04.2024
PL EN
20.04.2023 aktualizacja 20.04.2023

Intrygujące statystyki dotyczące interpunkcji w światowej literaturze

Fot. Adobe Stock Fot. Adobe Stock

W kilkuset dziełach literackich powstałych w siedmiu językach, głównie zachodnich, zaobserwowano te same cechy statystyczne schematów używania znaków przestankowych - informują naukowcy z IFJ PAN.

"Chwila zawahania... Tak, tu kropka – ale czy przecinek na pewno należy postawić tam? A może lepszy byłby myślnik? Interpunkcja potrafi przysparzać kłopotów; często się ją wręcz lekceważy. Błąd! Z najnowszych analiz statystycznych wyłania się inny jej obraz: interpunkcja zdaje się 'wyrastać' z fundamentów współdzielonych przez wszystkie (poddane badaniu) języki, a jej cechy są dalekie od trywialnych" - czytamy we wstępie komunikatu Instytutu Fizyki Jądrowej PAN w Krakowie. Fragment ten swoją drogą kompiluje użycie 10 znaków przestankowych (a są to: wielokropek, przecinek, myślnik, znak zapytania, średnik, kropka, znak wykrzyknienia, dwukropek, cudzysłów i nawiasy).

Naukowcy z IFJ PAN wzięli na warsztat kilkaset dzieł powstałych w siedmiu językach, głównie zachodnich. Zaobserwowali tam te same cechy statystyczne schematów używania znaków przestankowych. Wyniki ich badań ukazały się w czasopiśmie „Chaos, Solitons & Fractals”.

Jak podsumowano wnioski z badań w komunikacie, "interpunkcja (...) okazuje się być uniwersalnym i niezbędnym dopełnieniem matematycznej perfekcji każdego badanego języka".

Widoczne na ilustracji funkcje hazardu pokazują prawdopodobieństwo  wystąpienia kolejnego znaku interpunkcyjnego w zależności od długości  pozbawionej interpunkcji sekwencji wyrazów. Pod względem interpunkcyjnym  najbardziej „międzyjęzykowy” jest niemiecki (wykres zielony). (Źródło:  IFJ PAN)
Widoczne na ilustracji funkcje hazardu pokazują prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego w zależności od długości pozbawionej interpunkcji sekwencji wyrazów. Pod względem interpunkcyjnym najbardziej „międzyjęzykowy” jest niemiecki (wykres zielony). (Źródło: IFJ PAN)

„Obecne analizy są rozwinięciem naszych wcześniejszych wyników nad multifraktalnymi cechami zmienności długości zdań dzieł literatury światowej" - mówi prof. Stanisław Drożdż (IFJ PAN, Politechnika Krakowska). I zwraca uwagę: "Czym bowiem jest długość zdania? To nic innego jak odległość do kolejnego, konkretnego znaku interpunkcyjnego: kropki. Teraz wzięliśmy więc pod statystyczną lupę wszystkie znaki interpunkcyjne, przyjrzeliśmy się także, co się dzieje z interpunkcją podczas tłumaczeń".

Badaniom poddano dwa zbiory tekstów. Główne analizy dotyczące interpunkcji wewnątrz każdego z języków przeprowadzono na 240 cieszących się dużą popularnością dziełach literackich, napisanych w siedmiu językach, głównie zachodnich: angielskim (44), niemieckim (34), francuskim (32), włoskim (32), hiszpańskim (32), polskim (34) i rosyjskim (32).

Osobny zbiór przygotowano pod kątem obserwacji stabilności interpunkcji w tłumaczeniach. Zawierał on 14 dzieł, z których każde było dostępne w każdym z badanych języków.

Łącznie w obu zbiorach wśród autorów znaleźli się tacy twórcy jak: J. Conrad, Ch. Dickens, A. C. Doyle, E. Hemingway, J. R. Kipling, G. Orwell, J. D. Salinger, A. V. Woolf, G. Grass, F. Kafka, T. Mann, F. Nietzsche, J. W. von Goethe, M. M. de La Fayette, A. Dumas, V. Hugo, M. Proust, J. Verne, U. Eco, M. de Cervantes, H. Sienkiewicz czy W. Reymont.

Uwagę krakowskich badaczy przykuł przede wszystkim rozkład statystyczny odległości między kolejnymi znakami interpunkcyjnymi. Szybko się okazało, że we wszystkich badanych językach najlepiej opisuje go jeden z precyzyjnie określonych wariantów rozkładu Weibulla.

Krzywa tego typu ma charakterystyczny kształt: początkowo rośnie gwałtownie, by po osiągnięciu wartości maksymalnej nieco wolniej opaść do pewnej wartości krytycznej, poniżej której zdąża do zera już z małą i ciągle malejącą dynamiką.

Rozkładem Weibulla zwykle opisuje się zjawiska związane z przetrwaniem (np. liczbę ludności w funkcji wieku), ale także różne procesy fizyczne, jak choćby rosnące zmęczenie materiałów.

„Zgodność rozkładu długości sekwencji wyrazów między znakami interpunkcyjnymi z funkcjonalną postacią rozkładu Weibulla była tym lepsza, im więcej rodzajów znaków interpunkcyjnych uwzględnialiśmy w analizach; dla wszystkich znaków zgodność ta okazywała się niemal pełna. Jednocześnie między poszczególnymi językami są widoczne pewne różnice w rozkładach, ale sprowadzają się one tylko do doboru nieco innych wartości parametrów rozkładu, charakterystycznych dla danego języka. Interpunkcja wydaje się więc być integralną częścią wszystkich badanych języków” - zauważa prof. Drożdż.

Kolejny etap analiz polegał na wyznaczaniu funkcji hazardu. W przypadku interpunkcji opisuje ona, jak zmienia się warunkowe prawdopodobieństwo sukcesu – czyli prawdopodobieństwo wystąpienia kolejnego znaku interpunkcyjnego – jeśli w analizowanej sekwencji żaden taki znak jeszcze się nie pojawił.

Wyniki - czytamy w komunikacie - są tu jednoznaczne: językiem charakteryzującym się najmniejszą skłonnością do używania interpunkcji jest angielski, z niewiele mu ustępującym hiszpańskim; najbardziej uzależnione od interpunkcji okazały się języki słowiańskie.

Krzywe funkcji hazardu dla znaków interpunkcyjnych w sześciu badanych językach okazały się mieć podobny przebieg, różniły się bowiem głównie przesunięciem w pionie.

Wyjątkiem okazał się język niemiecki. Jego funkcja hazardu jako jedyna przecina większość krzywych skonstruowanych dla pozostałych języków. "Niemiecka interpunkcja zdaje się więc łączyć cechy interpunkcyjne wielu języków, co czyni z niej swoiste interpunkcyjne esperanto" - oceniają naukowcy.

Powyższa obserwacja współgra z kolejną analizą, która polegała na sprawdzeniu, czy cechy interpunkcyjne oryginalnych dzieł literackich widać w ich tłumaczeniach.

Zgodnie z oczekiwaniami, językiem najwierniej odwzorowującym interpunkcję od języka oryginału do języka docelowego okazał się niemiecki.

W przekazie mówionym przerwy można uzasadniać ludzką fizjologią, między innymi koniecznością zaczerpnięcia oddechu lub wygospodarowaniem chwili na ustrukturyzowanie w myślach dalszej wypowiedzi. A w przekazie pisanym?

„Tworzenie zdania poprzez dokładanie do niego kolejnych wyrazów przy jednoczesnym dbaniu, by przekaz był zrozumiały i jednoznaczny, nieco przypomina napinanie cięciwy łuku: na początku jest to łatwe, ale z każdą chwilą staje się coraz bardziej wymagające. Jeśli w tekście nie ma żadnych elementów porządkujących (a przecież taką rolę pełni interpunkcja), trudność interpretacji rośnie wraz z wydłużaniem się ciągu wyrazów. Zbyt mocno napięta cięciwa może pęknąć, a zbyt długie zdanie może stać się niezrozumiałe. Dlatego autor staje przed koniecznością 'uwolnienia strzały', czyli zamknięcia fragmentu tekstu jakimś znakiem interpunkcyjnym. Obserwacja ta dotyczy wszystkich analizowanych języków, mamy więc do czynienia z czymś, co można byłoby nazwać prawem lingwistycznym” - stwierdza cytowany w komunikacie dr Tomasz Stanisz (IFJ PAN), pierwszy autor omawianego artykułu.

Badacze stwierdzają, że wynalazek interpunkcji jest stosunkowo niedawny, a pojawienie się optymalnych wzorców interpunkcji we współczesnych językach pisanych może być interpretowane jako efekt ich "zaawansowania ewolucyjnego".

"Jednak nadmierna potrzeba użycia interpunkcji niekoniecznie musi być oznaką takiego zaawansowania. Języki angielski i hiszpański, współcześnie najbardziej uniwersalne, w świetle powyższych badań okazują się być mniej rygorystyczne w kwestii częstości stosowania interpunkcji. Prawdopodobnie języki te są tak sformalizowane pod względem konstrukcji zdania, że jest w nich mniej miejsca na niejednoznaczności, które musiałyby być rozwiązywane za pomocą znaków interpunkcyjnych" - czytamy w komunikacie.(PAP)

Nauka w Polsce

lt/ agt/

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Copyright © Fundacja PAP 2024