Ocena:
Ogólnie rzecz biorąc, książka jest uważana za doskonałe źródło informacji na temat czyszczenia danych przy użyciu Pythona, oferując praktyczne porady, jasne wyjaśnienia i liczne przykłady kodowania. Chociaż służy ona zarówno jako kompleksowe wprowadzenie dla początkujących, jak i pomocne odniesienie dla doświadczonych naukowców zajmujących się danymi, niektórzy recenzenci zauważyli obszary wymagające poprawy, szczególnie w zakresie formatowania kodu i włączenia grafiki.
Zalety:Książka jest bardzo praktyczna, zapewniając jasne i uporządkowane wyjaśnienia, liczne przykłady oraz bogactwo technik czyszczenia danych, manipulacji i wizualizacji. Służy jako doskonały elementarz dla osób początkujących w nauce o danych lub sztucznej inteligencji i jest szczególnie ceniony za wgląd, organizację i użyteczność jako szybki przewodnik referencyjny. Recenzenci docenili nacisk na zrozumienie rozumowania stojącego za zadaniami przetwarzania danych, co usprawnia naukę.
Wady:Niektórzy recenzenci zwrócili uwagę na takie kwestie, jak źle sformatowane przykłady kodu, które są trudne do odczytania, minimalne wykorzystanie grafiki w przeciwieństwie do typowej analizy danych eksploracyjnych oraz potrzebę bardziej złożonych tematów, takich jak czyszczenie danych szeregów czasowych. Kilka osób zauważyło, że choć książka stanowi solidny punkt wyjścia, to może nie obejmować dogłębnie każdego zaawansowanego tematu.
(na podstawie 28 opinii czytelników)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Dowiedz się, jak szczegółowo opisać swoje dane, zidentyfikować problemy z danymi i dowiedzieć się, jak je rozwiązać za pomocą powszechnie stosowanych technik oraz porad i wskazówek.
Kluczowe cechy
⬤ Poznaj różne techniki czyszczenia danych, aby ujawnić kluczowe spostrzeżenia.
⬤ Manipulowanie danymi o różnym stopniu złożoności w celu nadania im odpowiedniej formy zgodnie z potrzebami biznesowymi.
⬤ Czyszczenie, monitorowanie i walidacja dużych wolumenów danych w celu zdiagnozowania problemów przed przejściem do analizy danych.
Opis książki
Uzyskanie czystych danych w celu ujawnienia spostrzeżeń jest niezbędne, ponieważ bezpośrednie przejście do analizy danych bez odpowiedniego czyszczenia danych może prowadzić do nieprawidłowych wyników. Ta książka pokazuje narzędzia i techniki, które można zastosować do czyszczenia i obsługi danych za pomocą Pythona. Zaczniesz od zapoznania się z kształtem danych, korzystając z praktyk, które można rutynowo wdrażać w przypadku większości źródeł danych. Następnie książka uczy, jak manipulować danymi, aby nadać im użyteczną formę. Dowiesz się również, jak filtrować i podsumowywać dane, aby uzyskać wgląd i lepiej zrozumieć, co ma sens, a co nie, a także jak operować na danych, aby rozwiązać zidentyfikowane problemy. Następnie będziesz wykonywać kluczowe zadania, takie jak obsługa brakujących wartości, sprawdzanie poprawności błędów, usuwanie duplikatów danych, monitorowanie dużych ilości danych oraz obsługa wartości odstających i nieprawidłowych dat. Następnie omówione zostaną przepisy dotyczące korzystania z nadzorowanego uczenia się i analizy Naive Bayes w celu identyfikacji nieoczekiwanych wartości i błędów klasyfikacji oraz generowania wizualizacji do eksploracyjnej analizy danych (EDA) w celu wizualizacji nieoczekiwanych wartości. Wreszcie, będziesz tworzyć funkcje i klasy, które można ponownie wykorzystać bez modyfikacji, gdy masz nowe dane.
Pod koniec tej książki w Pythonie będziesz wyposażony we wszystkie kluczowe umiejętności potrzebne do czyszczenia danych i diagnozowania problemów w nich występujących.
Czego się nauczysz
⬤ Dowiesz się, jak odczytywać i analizować dane z różnych źródeł.
⬤ Tworzyć podsumowania atrybutów ramek danych, kolumn i wierszy.
⬤ Filtrować dane i wybierać interesujące kolumny, które spełniają określone kryteria.
⬤ Rozwiązywanie problemów związanych z nieuporządkowanymi danymi, w tym praca z datami i brakującymi wartościami.
⬤ Zwiększ swoją produktywność w Pythonie pandas za pomocą łańcuchowania metod.
⬤ Korzystanie z wizualizacji w celu uzyskania dodatkowych informacji i zidentyfikowania potencjalnych problemów z danymi.
⬤ Zwiększ swoją zdolność do uczenia się tego, co dzieje się w Twoich danych.
⬤ Twórz funkcje i klasy zdefiniowane przez użytkownika, aby zautomatyzować czyszczenie danych.
Dla kogo jest ta książka
Ta książka jest przeznaczona dla każdego, kto szuka sposobów radzenia sobie z nieuporządkowanymi, zduplikowanymi i słabymi danymi przy użyciu różnych narzędzi i technik Pythona. Książka przyjmuje podejście oparte na przepisach, aby pomóc ci nauczyć się czyścić dane i zarządzać nimi. Praktyczna znajomość programowania w Pythonie to wszystko, czego potrzebujesz, aby w pełni wykorzystać możliwości tej książki.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)