
Unleashing the Power of Syntactic N-Grams: A Solution for Explainable Cognitive Linguistics
W ostatnim czasie w przetwarzaniu języka naturalnego pojawiły się kosztowne obliczeniowo (choć skuteczne) technologie radzenia sobie z niuansami języka. Podczas gdy tradycyjne podejścia wydają się być obecnie mniej popularne, istnieje kilka zalet, które mogą one zapewnić. W szczególności modele oparte na n-gramach sprzyjają wyjaśnialności algorytmów opartych na sztucznej inteligencji. Dlatego właśnie powstała ta książka.
Ostatnie badania zastosowane w powiązanych obszarach (Sidorov, 2013) pokazują, że n-gramy składniowe mogą pomóc w usprawnieniu kilku zadań, ponieważ uwzględniają nie tylko słowa wyrażeń, ale także ich części mowy i połączenia na duże odległości, które mogą uchwycić. Wadą n-gramów składniowych może być potrzeba parsera, który może być powolny i może nie być dostępny dla wszystkich języków, więc korzyści z korzystania z tego dodatkowego zasobu powinny być jasne. W tej pracy przedstawiamy dogłębne badania w celu przedstawienia mocnych i słabych stron korzystania z n-gramów składniowych w różnych zastosowaniach. Niektóre z nich skorzystały na tym podejściu, podczas gdy inne zostały tylko w niewielkim stopniu zbadane. Przedstawiamy między innymi kilka technik powiązań tekstowych, korekcji błędów i wykrywania fałszywych wiadomości. Oceniane są różne rodzaje n-gramów składniowych (sn-gramów): sn-gramy oparte na zależnościach i sn-gramy oparte na składnikach. Oceniamy również te warianty wraz z ciągłymi i nieciągłymi sn-gramami. Oczekujemy, że ta książka pomoże naszym czytelnikom docenić korzyści płynące z używania n-gramów i n-gramów składniowych w wielu zastosowaniach.
Te wyszczególnione w tej książce i wiele innych można znaleźć w rozległej dziedzinie lingwistyki obliczeniowej.