– Najpierw musimy zbudować bazę materiałową. Zbudowanie tej bazy materiałowej będzie polegało na stworzeniu tzw. korpusów równoległych. Korpusów, czyli bardzo dużych baz danych językowych. Korpusów równoległych w tych 13 językach, ponieważ te korpusy polegają przede wszystkim na tym, że ten sam tekst jest tłumaczony na różne języki i dane konstrukcje które nas interesują, będziemy szukać w różnych językach jak one są wyrażane – mówi prof. dr hab. Bożena Rozwadowska, Wydział Filologiczny Uniwersytetu Wrocławskiego.
Języki słowiańskie nie zostały jeszcze tak dobrze zbadane, dlatego przed lingwistami z UWr-u dużo pracy. Na początku będą musieli wybrać tekst, który będzie przetłumaczony na tyle języków. W ich badaniach językiem referencyjnym, czyli stanowiącym punkt odniesienia dla wszystkich, będzie język angielski, bo w projekt zaangażowane będą osoby mówiący właśnie w wybranych językach słowiańskich.
– Polski, czeski, słowiański, słowacki, rosyjski, ukraiński, serbski, słoweński, macedoński, bułgarski, dwa bałtyckie litewski i łotewski. Nie interesują nas tzw. content words, czyli samo słowo w słowie, nas interesują pewne konstrukcje, czyli aspekt dokonany, aspekt niedokonany – dodaje prof. dr hab. Bożena Rozwadowska, Wydział Filologiczny Uniwersytetu Wrocławskiego.
W ramach projektu lingwiści wykonają także badania psycholingwistyczne polegające na sprawdzeniu tego, w jaki sposób ludzki mózg reaguje na przykład na błędy składniowe w zdaniu. Różnice i podobieństwa znaczeniowe w językach to obszar zainteresowania lingwistów teoretycznych, którzy na ich podstawie układają różnego rodzaju teorie porównawcze. Badacze z Uniwersytetu Wrocławskiego chcą je zweryfikować.
– Pierwsza rzecz to będziemy weryfikować hipotezy teoretyczne, które sobie w świecie istnieją i niekoniecznie zostały dobrze zweryfikowane dla języków słowiańskich, ponieważ jest to grupa języków jeszcze troszeczkę niedopracowana pod względem badań. Jest to zadanie, które integruje językoznawstwo komputerowe z językoznawstwem teoretycznym. Dodatkowymi efektami tego projektu będzie, przy pomocy e-specjalistów od przetwarzania języka naturalnego stworzenie bazy materiałowej do ulepszenia tłumaczeń maszynowych – podkreśla prof. dr hab. Bożena Rozwadowska, Wydział Filologiczny Uniwersytetu Wrocławskiego.