Ocena:

Recenzje książki podkreślają mieszany odbiór, z niektórymi użytkownikami doceniającymi jej pokrycie PySpark, zwłaszcza kilka pierwszych rozdziałów, oraz łatwość przejścia dla użytkowników Pythona. Jednak kilka krytycznych opinii wspomina o braku głębi, słabej jakości pisania i niewystarczających szczegółach, co prowadzi do frustracji z ogólnego wykonania.
Zalety:⬤ Dobrze omawia PySpark, zwłaszcza w początkowych rozdziałach
⬤ przydatne do samodzielnego uczenia się i przejścia z Pythona na PySpark
⬤ dobre przykłady
⬤ pomocne dla początkujących i średnio zaawansowanych w nauce o danych.
⬤ Słabo napisana z wieloma błędami
⬤ brakuje szczegółowych informacji technicznych i przejrzystości
⬤ trywialne przykłady i niewystarczające wyjaśnienie opcji
⬤ ogólne wykonanie uznane za niezadowalające
⬤ znaczne niezadowolenie z edycji i jakości treści.
(na podstawie 5 opinii czytelników)
Applied Data Science Using Pyspark: Learn the End-To-End Predictive Model-Building Cycle
Odkryj możliwości PySpark i jego zastosowanie w dziedzinie nauki o danych. Ten kompleksowy przewodnik z ręcznie dobranymi przykładami codziennych przypadków użycia przeprowadzi Cię przez kompleksowy cykl budowania modeli predykcyjnych z wykorzystaniem najnowszych technik i sztuczek branżowych.
Książka "Applied Data Science Using PySpark" podzielona jest na sześć rozdziałów, które przeprowadzą Cię przez jej treść. W sekcji 1 zaczynamy od podstaw PySpark, koncentrując się na manipulacji danymi. Sprawiamy, że czujesz się komfortowo z językiem, a następnie opieramy się na nim, aby wprowadzić cię w funkcje matematyczne dostępne z półki. W sekcji 2 zagłębimy się w sztukę selekcji zmiennych, demonstrując różne techniki selekcji dostępne w PySpark. W sekcji 3 zabierzemy Cię w podróż przez algorytmy uczenia maszynowego, implementacje i techniki dostrajania. Porozmawiamy również o różnych metrykach walidacji i sposobach ich wykorzystania do wyboru najlepszych modeli. Sekcje 4 i 5 omawiają potoki uczenia maszynowego i różne dostępne metody operacjonalizacji modelu i udostępniania go za pośrednictwem Docker / API. W ostatniej sekcji omówione zostaną obiekty wielokrotnego użytku ułatwiające eksperymentowanie i poznasz kilka sztuczek, które mogą pomóc w optymalizacji programów i potoków uczenia maszynowego.
Pod koniec tej książki zobaczysz elastyczność i zalety PySpark w aplikacjach do nauki o danych. Ta książka jest polecana tym, którzy chcą uwolnić moc obliczeń równoległych, pracując jednocześnie z dużymi zbiorami danych.
Czego się nauczysz
⬤ Zbuduj kompleksowy model predykcyjny.
⬤ Wdrażać techniki wyboru wielu zmiennych.
⬤ Obsługiwać modele.
⬤ Opanować wiele algorytmów i implementacji.
Dla kogo jest ta książka
Naukowcy zajmujący się danymi oraz inżynierowie zajmujący się uczeniem maszynowym i głębokim uczeniem, którzy chcą nauczyć się i używać PySpark do analizy danych strumieniowych w czasie rzeczywistym.