Ocena:

Książka „Python Natural Language Processing Cookbook” autorstwa Zhenyi Antić jest ogólnie dobrze przyjęta ze względu na praktyczne podejście do NLP, dostarczając przydatnych przepisów na różne zadania NLP i obejmując zarówno podstawowe, jak i zaawansowane tematy. Jednak spotyka się z krytyką za liczne błędy w kodowaniu i niespójności, które utrudniają naukę niektórym czytelnikom.
Zalety:⬤ Łatwy do odczytania z jasnymi przykładami.
⬤ Przydatna zarówno dla początkujących, jak i zaawansowanych praktyków.
⬤ Zawiera praktyczne, krok po kroku przepisy na zadania NLP.
⬤ Dobre pokrycie nowoczesnych koncepcji NLP, w tym wykorzystanie narzędzi takich jak Rasa i BERT.
⬤ Repozytorium GitHub oferuje dopasowywanie wersji pakietów.
⬤ Pomaga w tworzeniu projektów od podstaw.
⬤ Znaczna liczba błędów kodowania znalezionych w przykładach.
⬤ Niektórzy czytelnicy napotkali problemy z dostępem do źródeł danych.
⬤ Minimalne wyjaśnienia skomplikowanych pojęć i terminologii.
⬤ Niektórzy uważali, że przejścia między różnymi bibliotekami nie zostały dobrze wyjaśnione.
⬤ Wymaga od czytelników wcześniejszej znajomości pewnego żargonu, przez co jest mniej przyjazna dla początkujących niż zamierzano.
(na podstawie 15 opinii czytelników)
Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks
Zapoznaj się z rozwiązywaniem rzeczywistych problemów NLP, takich jak parsowanie zależności, ekstrakcja informacji, modelowanie tematów i wizualizacja danych tekstowych.
Kluczowe cechy:
⬤ Analiza różnej złożoności tekstu przy użyciu popularnych pakietów Pythona, takich jak NLTK, spaCy, sklearn i gensim.
⬤ Wdrażanie powszechnych i niezbyt powszechnych zadań przetwarzania językowego przy użyciu bibliotek Pythona.
⬤ Pokonywanie typowych wyzwań napotykanych podczas wdrażania potoków NLP.
Opis książki:
Python jest najczęściej używanym językiem do przetwarzania języka naturalnego (NLP) dzięki rozbudowanym narzędziom i bibliotekom do analizy tekstu i wydobywania danych użytecznych komputerowo. Ta książka poprowadzi Cię przez szereg technik przetwarzania tekstu, od podstaw, takich jak analizowanie części mowy, po złożone tematy, takie jak modelowanie tematów, klasyfikacja tekstu i wizualizacja.
Zaczynając od przeglądu NLP, książka przedstawia przepisy na dzielenie tekstu na zdania, stemming i lemmatyzację, usuwanie słów stop i tagowanie części mowy, aby pomóc w przygotowaniu danych. Następnie poznasz sposoby wyodrębniania i reprezentowania informacji gramatycznych, takich jak parsowanie zależności i rozwiązywanie anafor, odkryjesz różne sposoby reprezentowania semantyki za pomocą worka słów, TF-IDF, osadzania słów i BERT, a także rozwiniesz umiejętności klasyfikacji tekstu za pomocą słów kluczowych, SVM, LSTM i innych technik. W miarę postępów zobaczysz także, jak wyodrębniać informacje z tekstu, wdrażać nienadzorowane i nadzorowane techniki modelowania tematów oraz modelować tematy krótkich tekstów, takich jak tweety. Ponadto książka pokazuje, jak tworzyć chatboty przy użyciu NLTK i Rasa oraz wizualizować dane tekstowe.
Pod koniec tej książki o NLP rozwiniesz umiejętności korzystania z potężnego zestawu narzędzi do przetwarzania tekstu.
Czego się nauczysz:
⬤ Będziesz dobrze zaznajomiony z podstawowymi i zaawansowanymi technikami NLP w Pythonie.
⬤ Przedstawiać informacje gramatyczne w tekście za pomocą spaCy, a informacje semantyczne za pomocą bag-of-words, TF-IDF i osadzania słów.
⬤ Przeprowadzanie klasyfikacji tekstu przy użyciu różnych metod, w tym SVM i LSTM.
⬤ Badanie różnych technik modelowania tematycznego, takich jak K-średnich, LDA, NMF i BERT.
⬤ Praca z technikami wizualizacji, takimi jak NER i chmury słów dla różnych narzędzi NLP.
⬤ Zbuduj podstawowego chatbota przy użyciu NLTK i Rasa.
⬤ Wydobywanie informacji z tekstu przy użyciu technik wyrażeń regularnych oraz narzędzi statystycznych i głębokiego uczenia się.
Dla kogo jest ta książka:
Ta książka jest przeznaczona dla naukowców zajmujących się danymi i profesjonalistów, którzy chcą nauczyć się pracować z tekstem. Średnio zaawansowana znajomość języka Python pomoże ci w pełni wykorzystać tę książkę. Jeśli jesteś praktykiem NLP, ta książka będzie służyć jako odniesienie do kodu podczas pracy nad projektami.