Ocena:
Książka jest źródłem wiedzy na temat Hadoop i analityki Big Data, z naciskiem zarówno na podstawowe, jak i zaawansowane tematy. Chociaż zapewnia szeroki przegląd ekosystemu Hadoop i zawiera praktyczne przykłady, ma również znaczące problemy z dokładnością kodu i przejrzystością pisania.
Zalety:⬤ Kompleksowy przegląd Hadoop i powiązanych technologii
⬤ przyjazny zarówno dla początkujących, jak i profesjonalistów
⬤ przykłady są pomocne w praktycznej nauce
⬤ aktualny zarówno ze starymi, jak i nowymi technologiami, takimi jak MapReduce i Spark
⬤ zawiera cytaty do dalszej lektury.
⬤ Przykładowy kod często nie pasuje do opisów w książce
⬤ instrukcje instalacji mogą być mylące
⬤ przykłady mogą dawać nieprawidłowe wyniki
⬤ styl pisania jest krytykowany jako pozbawiony jakości
⬤ niektóre informacje są mylące lub niepoprawne.
(na podstawie 9 opinii czytelników)
Data Analytics with Hadoop: An Introduction for Data Scientists
Gotowy do korzystania z technik statystycznych i uczenia maszynowego w dużych zbiorach danych? Ten praktyczny przewodnik pokazuje, dlaczego ekosystem Hadoop jest idealny do tego zadania.
Zamiast zajmować się wdrażaniem, operacjami lub tworzeniem oprogramowania zwykle związanego z obliczeniami rozproszonymi, skupisz się na konkretnych analizach, które możesz zbudować, technikach hurtowni danych, które zapewnia Hadoop, oraz przepływach pracy danych wyższego rzędu, które może wytworzyć ten framework. Naukowcy i analitycy danych nauczą się, jak wykonywać szeroki zakres technik, od pisania aplikacji MapReduce i Spark w Pythonie po korzystanie z zaawansowanego modelowania i zarządzania danymi za pomocą Spark MLlib, Hive i HBase.
Dowiesz się także o procesach analitycznych i systemach danych dostępnych do tworzenia i wzmacniania produktów danych, które mogą obsługiwać - a właściwie wymagają - ogromnych ilości danych. ⬤ Zrozumienie podstawowych koncepcji stojących za Hadoop i obliczeniami klastrowymi ⬤ Wykorzystanie wzorców projektowych i równoległych algorytmów analitycznych do tworzenia rozproszonych zadań analizy danych ⬤ Poznanie zarządzania danymi, eksploracji i magazynowania w kontekście rozproszonym przy użyciu Apache Hive i HBase ⬤ Wykorzystanie Sqoop i Apache Flume do pozyskiwania danych z relacyjnych baz danych ⬤ Programowanie złożonych aplikacji Hadoop i Spark za pomocą Apache Pig i Spark DataFrames ⬤ Wykonywanie technik uczenia maszynowego, takich jak klasyfikacja, klastrowanie i filtrowanie kolaboracyjne za pomocą Spark MLlib.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)