Ocena:
Książka zapewnia wnikliwą i dogłębną eksplorację nowoczesnych architektur danych, koncentrując się na architekturze delta, zarządzaniu danymi i tworzeniu produktów danych w ramach siatki danych. Podkreśla również znaczenie wizualizacji danych i praktycznych zastosowań w rzeczywistych scenariuszach przy użyciu języka Python.
Zalety:Kompleksowe omówienie nowoczesnych architektur danych, praktyczne przykłady w Pythonie, wnikliwa eksploracja ładu i integralności danych, skupienie się na MLOps i integracji wizualizacji danych, dostępne dla inżynierów, analityków i menedżerów.
Wady:Może być zbyt techniczna dla początkujących bez wcześniejszej wiedzy o architekturach danych, niektórzy czytelnicy mogą uznać jej głębię za przytłaczającą i może nie obejmować wszystkich tematów szczegółowo.
(na podstawie 5 opinii czytelników)
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Tworzenie skalowalnych i niezawodnych ekosystemów danych przy użyciu Data Mesh, Databricks Spark i Kafka
Kluczowe cechy:
⬤ Rozwój nowoczesnych umiejętności w zakresie danych wykorzystywanych w nowych technologiach.
⬤ Poznanie pragmatycznych metodologii projektowania, takich jak Data Mesh i data lakehouses.
⬤ Głębsze zrozumienie zarządzania danymi.
⬤ Zakup książki w wersji drukowanej lub Kindle obejmuje bezpłatny eBook w formacie PDF.
Opis książki:
Nowoczesne architektury danych z Pythonem nauczą Cię, jak płynnie włączać strumienie pracy związane z uczeniem maszynowym i nauką o danych do otwartych platform danych. Dowiesz się, jak pobierać dane i tworzyć otwarte jeziora, które współpracują z dowolną technologią przy użyciu wypróbowanych i sprawdzonych technik, w tym architektury medalionu i Delta Lake.
Zaczynając od podstaw, ta książka pomoże ci zbudować potoki na Databricks, otwartej platformie danych, przy użyciu SQL i Pythona. Zapoznasz się z notatnikami i aplikacjami napisanymi w Pythonie przy użyciu standardowych narzędzi inżynierii oprogramowania, takich jak git, pre-commit, Jenkins i Github. Następnie zagłębisz się w strumieniowe i wsadowe przetwarzanie danych przy użyciu Apache Spark i Confluent Kafka. W miarę postępów dowiesz się, jak wdrażać zasoby przy użyciu infrastruktury jako kodu oraz jak zautomatyzować przepływy pracy i tworzenie kodu. Ponieważ zdolność każdej platformy danych do obsługi i pracy ze sztuczną inteligencją i uczeniem maszynowym jest istotnym elementem, poznasz również podstawy uczenia maszynowego i dowiesz się, jak pracować z nowoczesnymi narzędziami MLOps. Wreszcie, zdobędziesz praktyczne doświadczenie z Apache Spark, jedną z kluczowych technologii danych na dzisiejszym rynku.
Pod koniec tej książki zgromadzisz bogatą wiedzę praktyczną i teoretyczną do budowania, zarządzania, orkiestracji i architektury ekosystemów danych.
Czego się nauczysz:
⬤ Zrozumieć wzorce danych, w tym architekturę delta.
⬤ Odkryć, jak zwiększyć wydajność dzięki wewnętrznym elementom Sparka.
⬤ Dowiesz się, jak projektować krytyczne diagramy danych.
⬤ Poznaj MLOps za pomocą narzędzi takich jak AutoML i MLflow.
⬤ Zapoznanie się z tworzeniem produktów danych w siatce danych.
⬤ Odkryj zarządzanie danymi i zbuduj zaufanie do swoich danych.
⬤ Wprowadzić wizualizacje danych i pulpity nawigacyjne do swojej praktyki w zakresie danych.
Dla kogo jest ta książka:
Ta książka jest przeznaczona dla programistów, inżynierów analityków i menedżerów, którzy chcą dalej rozwijać ekosystem danych w swojej organizacji. Chociaż nie są to warunki wstępne, podstawowa znajomość języka Python i wcześniejsze doświadczenie z danymi pomogą w czytaniu i śledzeniu przykładów.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)