Ocena:

Książka o Sparku i PySparku oferuje wstępne zrozumienie różnych tematów, ale brakuje jej głębi i kompletności przykładów, co często prowadzi do frustrującego doświadczenia dla czytelników. Chociaż zapewnia szeroki przegląd odpowiedni dla nowicjuszy, wymaga również dodatkowych zasobów i wysiłku, aby wypełnić luki.
Zalety:⬤ Przyjazny ton i dobry dla początkujących użytkowników Sparka.
⬤ Obejmuje szeroki zakres tematów, w tym struktury danych i uczenie maszynowe.
⬤ Zawiera przykładowe kody, które mogą pomóc w nauce.
⬤ Dobry punkt wyjścia do zrozumienia podstawowych pojęć.
⬤ Przykłady są często niekompletne lub wymagają zewnętrznych zasobów, aby w pełni je zrozumieć, co utrudnia korzystanie z nich jako samodzielnego przewodnika.
⬤ Brak głębi w dyskusjach; wiele tematów jest omówionych tylko powierzchownie.
⬤ Przykłady kodu nie działają od razu i brakuje im niezbędnego kontekstu.
⬤ Słaba organizacja i paginacja w niektórych sekcjach utrudniają czytanie.
⬤ Ogólnie postrzegana jako napisana w pośpiechu lub pozbawiona spójnej struktury.
(na podstawie 10 opinii czytelników)
Learning PySpark: Build data-intensive applications locally and deploy at scale using the combined powers of Python and Spark 2.0
Twórz lokalnie aplikacje intensywnie przetwarzające dane i wdrażaj je na dużą skalę, korzystając z połączonych możliwości Pythona i Sparka 2. 0 O tej książce - Dowiedz się, dlaczego i jak możesz efektywnie używać Pythona do przetwarzania danych i budowania modeli uczenia maszynowego w Apache Spark 2.
0 - Rozwijaj i wdrażaj wydajne, skalowalne rozwiązania Spark w czasie rzeczywistym - Przenieś swoje zrozumienie korzystania ze Sparka z Pythonem na wyższy poziom dzięki temu przewodnikowi dla początkujących Dla kogo jest ta książka Jeśli jesteś programistą Pythona, który chce poznać ekosystem Apache Spark 2. 0, ta książka jest dla Ciebie. Oczekuje się solidnego zrozumienia Pythona, aby jak najlepiej wykorzystać tę książkę.
Znajomość Sparka będzie przydatna, ale nie jest obowiązkowa.
Czego się nauczysz - Poznaj Apache Spark i architekturę Spark 2. 0 - Budować i współdziałać ze Spark DataFrames przy użyciu Spark SQL - Dowiedzieć się, jak rozwiązywać problemy związane z grafami i głębokim uczeniem się przy użyciu odpowiednio GraphFrames i TensorFrames - Odczytywać, przekształcać i rozumieć dane oraz wykorzystywać je do trenowania modeli uczenia maszynowego - Budować modele uczenia maszynowego przy użyciu MLlib i ML - Dowiedzieć się, jak programowo przesyłać aplikacje przy użyciu spark-submit - Wdrażać lokalnie zbudowane aplikacje do klastra W szczegółach Apache Spark to framework typu open source do wydajnych obliczeń klastrowych z silnym interfejsem do równoległości danych i odporności na błędy.
Ta książka pokaże ci, jak wykorzystać moc Pythona i zastosować go w ekosystemie Spark. Zaczniesz od solidnego zrozumienia architektury Spark 2. 0 i jak skonfigurować środowisko Python dla Spark.
Zapoznasz się z modułami dostępnymi w PySpark. Dowiesz się, jak abstrahować dane za pomocą RDD i DataFrames oraz zrozumiesz możliwości PySpark w zakresie streamingu. Zapoznasz się również z możliwościami PySpark w zakresie uczenia maszynowego przy użyciu ML i MLlib, przetwarzania grafów przy użyciu GraphFrames oraz trwałości poliglotycznej przy użyciu Blaze.
Wreszcie, dowiesz się, jak wdrożyć swoje aplikacje w chmurze za pomocą polecenia spark-submit. Pod koniec tej książki będziesz miał solidną wiedzę na temat Spark Python API i tego, jak można go wykorzystać do tworzenia aplikacji intensywnie wykorzystujących dane.
Styl i podejście Ta książka przyjmuje bardzo kompleksowe podejście krok po kroku, dzięki czemu można zrozumieć, w jaki sposób ekosystem Spark może być używany z Pythonem do tworzenia wydajnych, skalowalnych rozwiązań. Każdy rozdział jest samodzielny i napisany w bardzo łatwy do zrozumienia sposób, z naciskiem zarówno na "jak", jak i "dlaczego" każdej koncepcji.