Ocena:
Książka służy jako wprowadzenie do Dask i jego możliwości, ale ma mieszane recenzje dotyczące docelowych odbiorców i głębi informacji. Chociaż oferuje dobry przegląd i porównania z Pandas, często zagłębia się w podstawowe koncepcje, które mogą nie być istotne dla docelowych czytelników.
Zalety:⬤ Dobre wprowadzenie dla początkujących
⬤ solidne wyjaśnienie struktur danych Dask
⬤ skuteczne porównanie z Pandas
⬤ cenne źródło informacji dla zrozumienia koncepcji nauki o danych
⬤ przejrzysta składnia i przypadki użycia.
⬤ Zbyt podstawowa dla średnio zaawansowanych użytkowników
⬤ zawiera nieistotne elementarne koncepcje
⬤ układ i struktura mogłyby zostać poprawione
⬤ zauważono pewne kwestie techniczne
⬤ treść może być zbyt szczegółowa dla docelowych odbiorców.
(na podstawie 6 opinii czytelników)
Data Science with Python and Dask
Podsumowanie
Dask to natywne narzędzie do analizy równoległej, zaprojektowane z myślą o płynnej integracji z już używanymi bibliotekami, w tym Pandas, NumPy i Scikit-Learn. Dzięki Dask możesz analizować i pracować z ogromnymi zbiorami danych, korzystając z narzędzi, które już posiadasz. A Data Science with Python and Dask to przewodnik po używaniu Dask do projektów związanych z danymi bez zmiany sposobu pracy.
Zakup książki drukowanej obejmuje bezpłatny eBook w formatach PDF, Kindle i ePub od Manning Publications. Instrukcje rejestracji znajdują się w książce drukowanej.
O technologii
Wydajny potok danych oznacza wszystko dla sukcesu projektu nauki o danych. Dask to elastyczna biblioteka do obliczeń równoległych w Pythonie, która ułatwia tworzenie intuicyjnych przepływów pracy do pozyskiwania i analizowania dużych, rozproszonych zbiorów danych. Dask zapewnia dynamiczne planowanie zadań i kolekcje równoległe, które rozszerzają funkcjonalność NumPy, Pandas i Scikit-learn, umożliwiając użytkownikom łatwe skalowanie kodu z jednego laptopa do klastra setek maszyn.
O książce
Data Science with Python and Dask uczy tworzenia skalowalnych projektów, które mogą obsługiwać ogromne zbiory danych. Po zapoznaniu się z frameworkiem Dask, przeanalizujesz dane w bazie danych NYC Parking Ticket i użyjesz DataFrames, aby usprawnić swój proces. Następnie będziesz tworzyć modele uczenia maszynowego przy użyciu Dask-ML, tworzyć interaktywne wizualizacje i budować klastry przy użyciu AWS i Docker.
Co w środku
⬤ Praca z dużymi, ustrukturyzowanymi i nieustrukturyzowanymi zbiorami danych.
⬤ Wizualizacja za pomocą Seaborn i Datashader.
⬤ Implementacja własnych algorytmów.
⬤ Tworzenie rozproszonych aplikacji z Dask Distributed.
⬤ Pakowanie i wdrażanie aplikacji Dask.
O czytelniku
Dla naukowców zajmujących się danymi i programistów z doświadczeniem w korzystaniu z Pythona i stosu PyData.
O autorze
Jesse Daniel jest doświadczonym programistą Pythona. Wykładał Python for Data Science na Uniwersytecie w Denver i kieruje zespołem naukowców zajmujących się danymi w firmie technologicznej z siedzibą w Denver.
Spis treści
CZĘŚĆ 1 - Elementy składowe skalowalnego przetwarzania danych.
⬤ Dlaczego skalowalne przetwarzanie danych ma znaczenie.
⬤ Wprowadzenie do Dask.
CZĘŚĆ 2 - Praca z danymi strukturalnymi przy użyciu Dask DataFrames.
⬤ Wprowadzenie do Dask DataFrames.
⬤ Ładowanie danych do DataFrames.
⬤ Czyszczenie i przekształcanie DataFrames.
⬤ Podsumowanie i analiza ramek DataFrame.
⬤ Wizualizacja DataFrames za pomocą Seaborn.
⬤ Wizualizacja danych lokalizacji za pomocą Datashader.
CZĘŚĆ 3 - Rozszerzanie i wdrażanie Dask.
⬤ Praca z workami i tablicami.
⬤ Uczenie maszynowe z Dask-ML.
⬤ Skalowanie i wdrażanie Dask.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)