Wysoka wydajność Spark: Najlepsze praktyki skalowania i optymalizacji Apache Spark

Ocena:   (4,2 na 5)

Wysoka wydajność Spark: Najlepsze praktyki skalowania i optymalizacji Apache Spark (Holden Karau)

Opinie czytelników

Podsumowanie:

Książka „High Performance Spark” oferuje szczegółowe badanie pisania wydajnego kodu Spark, odpowiedniego dla profesjonalistów z wcześniejszą znajomością Scali i Spark. Skupia się ona na optymalizacji wydajności i dostarcza dokładnych przykładów kodu, głównie w języku Scala. Podczas gdy niektórzy użytkownicy uznali go za dobrze zorganizowany i pouczający zasób, inni krytykowali jego dostępność dla początkujących i dużą zależność od Scali.

Zalety:

Wszechstronny przewodnik po pisaniu wysokowydajnego kodu Spark.
Szczegółowe wyjaśnienia zaawansowanych koncepcji i technik optymalizacji.
Dobrze skonstruowany z odpowiednią równowagą teorii i praktycznych zastosowań.
Bogaty w przykłady kodu, które poprawiają zrozumienie, szczególnie dla osób zaznajomionych ze Scalą.
Przejrzysta prezentacja, prostota i przydatne diagramy.

Wady:

Nieodpowiednia dla początkujących; wymaga wcześniejszej znajomości Sparka i Scali.
Duży nacisk na Scalę może zrazić użytkowników niezaznajomionych z tym językiem.
Niektórzy użytkownicy uważali, że jest zbyt gęsty i wymagający bez praktycznego środowiska Spark.
Ograniczony zakres niektórych tematów, takich jak streaming Spark.
Niektórzy uważali, że jest to nużące ze względu na nadmierną liczbę przykładów kodowania.

(na podstawie 27 opinii czytelników)

Oryginalny tytuł:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Zawartość książki:

Apache Spark jest niesamowity, gdy wszystko się zgadza. Jeśli jednak nie zauważyłeś oczekiwanej poprawy wydajności lub nadal nie czujesz się wystarczająco pewnie, aby używać Sparka w produkcji, ta praktyczna książka jest dla Ciebie. Autorzy Holden Karau i Rachel Warren demonstrują optymalizacje wydajności, dzięki którym zapytania Spark działają szybciej i obsługują większe rozmiary danych, zużywając przy tym mniej zasobów.

Idealna dla inżynierów oprogramowania, inżynierów danych, programistów i administratorów systemów pracujących z aplikacjami danych na dużą skalę, książka ta opisuje techniki, które mogą zmniejszyć koszty infrastruktury danych i godziny pracy programistów. Nie tylko zdobędziesz bardziej kompleksową wiedzę na temat Sparka, ale także dowiesz się, jak sprawić, by był skuteczny.

Dzięki tej książce poznasz:

⬤ Jak nowe interfejsy Spark SQL poprawiają wydajność w stosunku do struktury danych RDD SQL.

⬤ Wybór między łączeniem danych w Core Spark i Spark SQL.

⬤ Techniki maksymalnego wykorzystania standardowych transformacji RDD.

⬤ Jak obejść problemy z wydajnością w paradygmacie klucz/wartość Sparka.

⬤ Pisanie wydajnego kodu Spark bez Scali lub JVM.

⬤ Jak testować funkcjonalność i wydajność podczas stosowania sugerowanych ulepszeń.

⬤ Korzystanie z bibliotek uczenia maszynowego Spark MLlib i Spark ML.

⬤ Komponenty strumieniowe Spark i pakiety społeczności zewnętrznej.

Dodatkowe informacje o książce:

ISBN:9781491943205
Autor:
Wydawca:
Oprawa:Miękka oprawa
Rok wydania:2017
Liczba stron:358

Zakup:

Obecnie dostępne, na stanie.

Inne książki autora:

Wysoka wydajność Spark: Najlepsze praktyki skalowania i optymalizacji Apache Spark - High...
Apache Spark jest niesamowity, gdy wszystko się zgadza...
Wysoka wydajność Spark: Najlepsze praktyki skalowania i optymalizacji Apache Spark - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Skalowanie Pythona za pomocą Ray: Przygody w chmurze i wzorce bezserwerowe - Scaling Python with...
Przetwarzanie bezserwerowe umożliwia programistom...
Skalowanie Pythona za pomocą Ray: Przygody w chmurze i wzorce bezserwerowe - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Skalowanie Pythona z Dask: Od nauki o danych do uczenia maszynowego - Scaling Python with Dask: From...
Nowoczesne systemy zawierają wielordzeniowe...
Skalowanie Pythona z Dask: Od nauki o danych do uczenia maszynowego - Scaling Python with Dask: From Data Science to Machine Learning

Prace autora wydały następujące wydawnictwa:

© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)