Ocena:
Książka stanowi solidne wprowadzenie do Apache Spark, szczególnie dla osób już zaznajomionych z tworzeniem oprogramowania. Jest dobrze skonstruowana, obejmując podstawowe i zaawansowane tematy, głównie w Pythonie i odnosząc się do odpowiednich funkcji Spark. Niektórzy użytkownicy zwrócili jednak uwagę na nieaktualne informacje, w szczególności związane z instalacjami, oraz brak zaawansowanych przypadków użycia lub dogłębnego omówienia niektórych obszarów.
Zalety:⬤ Zapewnia dobrze zorganizowane i metodyczne podejście do szybkiej nauki.
⬤ Dobra dla początkujących i entuzjastów Pythona.
⬤ Obejmuje szeroką gamę funkcji Spark, w tym Spark-SQL i MLlib.
⬤ Przystępny i łatwy do przyswojenia, dzięki czemu nadaje się do szybkiej nauki Sparka.
⬤ Zawiera odniesienia do artykułów naukowych w celu głębszego zrozumienia.
⬤ Niektóre informacje są nieaktualne, szczególnie w odniesieniu do instalacji i binariów Hadoop.
⬤ Brak zaawansowanych przypadków użycia i wskazówek dotyczących dostrajania wydajności.
⬤ Skupia się głównie na Pythonie, kładąc mniejszy nacisk na Scalę lub zaawansowane tematy.
⬤ Zauważono kilka błędów ortograficznych, co wskazuje na potrzebę lepszej korekty.
⬤ Niektórym rozdziałom, takim jak Spark Streaming, brakuje głębi.
(na podstawie 23 opinii czytelników)
Apache Spark in 24 Hours, Sams Teach Yourself
Apache Spark to szybki, skalowalny i elastyczny silnik przetwarzania rozproszonego typu open source dla systemów Big Data i jest jednym z najbardziej aktywnych projektów Big Data typu open source. W zaledwie 24 lekcjach trwających godzinę lub mniej, Sams Teach Yourself Apache Spark in 24 Hours pomaga budować praktyczne rozwiązania Big Data, które wykorzystują niesamowitą szybkość, skalowalność, prostotę i wszechstronność Sparka.
Ta prosta książka krok po kroku pokazuje, jak wdrażać, programować, optymalizować, zarządzać, integrować i rozszerzać Sparka - teraz i przez wiele lat. Odkryjesz, jak tworzyć potężne rozwiązania obejmujące przetwarzanie w chmurze, przetwarzanie strumieniowe w czasie rzeczywistym, uczenie maszynowe i nie tylko. Każda lekcja opiera się na tym, czego już się nauczyłeś, dając ci solidne podstawy do odniesienia sukcesu w świecie rzeczywistym.
Niezależnie od tego, czy jesteś analitykiem danych, inżynierem danych, analitykiem danych czy administratorem danych, nauka Sparka pomoże Ci rozwinąć karierę lub rozpocząć nową karierę w dynamicznie rozwijającym się obszarze Big Data.
Dowiedz się, jak
- Odkryć, czym zajmuje się Apache Spark i jak wpisuje się w krajobraz Big Data.
- Wdrażać i uruchamiać Spark lokalnie lub w chmurze.
- Współpracować ze Sparkiem z poziomu powłoki.
- Jak najlepiej wykorzystać architekturę klastrową Spark.
- Rozwijaj aplikacje Spark za pomocą Scali i funkcjonalnego Pythona.
- Programować za pomocą interfejsu API Spark, w tym transformacji i akcji.
- Stosowanie praktycznych metod inżynierii/analizy danych zaprojektowanych dla Spark.
- Używanie odpornych rozproszonych zestawów danych (RDD) do buforowania, trwałości i danych wyjściowych.
- Optymalizacja wydajności rozwiązania Spark.
- Używanie Spark z SQL (poprzez Spark SQL) i NoSQL (poprzez Cassandra).
- Wykorzystanie najnowocześniejszych technik programowania funkcjonalnego.
- Rozszerz Spark o streaming, R i Sparkling Water.
- Rozpocznij tworzenie opartych na Spark aplikacji do uczenia maszynowego i przetwarzania grafów.
- Poznaj zaawansowane technologie przesyłania wiadomości, w tym Kafka.
- Zapoznaj się i przygotuj na kolejną generację innowacji Spark.
Instrukcje przeprowadzą Cię przez najczęstsze pytania, problemy i zadania.
Pytania i odpowiedzi, quizy i ćwiczenia poszerzają i sprawdzają wiedzę.
Wskazówki "Czy wiesz, że?" oferują poufne porady i skróty.
Alerty Watch Out pomagają uniknąć pułapek. Po ukończeniu kursu będziesz mógł swobodnie używać Apache Spark do rozwiązywania szerokiego spektrum problemów związanych z Big Data.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)