Ocena:
Obecnie brak opinii czytelników. Ocena opiera się na 2 głosach.
The Unicode Cookbook for Linguists
Niniejszy tekst jest praktycznym przewodnikiem dla lingwistów i programistów, którzy pracują z danymi w wielojęzycznych środowiskach obliczeniowych.
Wprowadzamy podstawowe pojęcia potrzebne do zrozumienia, jak działają systemy pisma i kodowania znaków oraz jak współpracują ze sobą na przecięciu standardu Unicode i międzynarodowego alfabetu fonetycznego. Chociaż standardy te często spotykają się z frustracją użytkowników, niemniej jednak zapewniają badaczom języków i programistom spójną architekturę obliczeniową potrzebną do przetwarzania, publikowania i analizowania danych leksykalnych z języków świata.
W ten sposób ujawniamy powszechne, ale nie zawsze przejrzyste, pułapki, z którymi borykają się badacze podczas pracy z Unicode i IPA. Po zidentyfikowaniu i przezwyciężeniu tych pułapek związanych ze składnią i semantyczną interoperacyjnością systemów pisania i kodowania znaków (w zakresie, w jakim mogą być), stworzyliśmy zestaw narzędzi Python i R o otwartym kodzie źródłowym do pracy z językami używającymi profili ortograficznych, które opisują konwencje ortograficzne specyficzne dla autora lub dokumentu. W tej książce kucharskiej opisujemy formalną specyfikację profili ortograficznych i dostarczamy przepisy wykorzystujące narzędzia open source, aby pokazać, w jaki sposób użytkownicy mogą segmentować tekst, analizować go, identyfikować błędy i przekształcać go w różne formy pisemne do badań w zakresie językoznawstwa porównawczego.
Ten utwór został opublikowany przez Saint Philip Street Press na licencji Creative Commons zezwalającej na użycie komercyjne. Wszelkie prawa nieudzielone na mocy licencji zachowuje autor lub autorzy.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)