Nowoczesne architektury danych z Pythonem: Tworzenie i wdrażanie potoków danych

Nowoczesne architektury danych z Pythonem: Praktyczny przewodnik po budowaniu i wdrażaniu potoków danych, hurtowni danych i jezior danych w języku Python (Brian Lipp)

Opinie czytelników

Podsumowanie:

Książka zapewnia wnikliwą i dogłębną eksplorację nowoczesnych architektur danych, koncentrując się na architekturze delta, zarządzaniu danymi i tworzeniu produktów danych w ramach siatki danych. Podkreśla również znaczenie wizualizacji danych i praktycznych zastosowań w rzeczywistych scenariuszach przy użyciu języka Python.

Zalety:

Kompleksowe omówienie nowoczesnych architektur danych, praktyczne przykłady w Pythonie, wnikliwa eksploracja ładu i integralności danych, skupienie się na MLOps i integracji wizualizacji danych, dostępne dla inżynierów, analityków i menedżerów.

Wady:

Może być zbyt techniczna dla początkujących bez wcześniejszej wiedzy o architekturach danych, niektórzy czytelnicy mogą uznać jej głębię za przytłaczającą i może nie obejmować wszystkich tematów szczegółowo.

(na podstawie 5 opinii czytelników)

Oryginalny tytuł:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Zawartość książki:

Tworzenie skalowalnych i niezawodnych ekosystemów danych przy użyciu Data Mesh, Databricks Spark i Kafka

Kluczowe cechy:

⬤ Rozwój nowoczesnych umiejętności w zakresie danych wykorzystywanych w nowych technologiach.

⬤ Poznanie pragmatycznych metodologii projektowania, takich jak Data Mesh i data lakehouses.

⬤ Głębsze zrozumienie zarządzania danymi.

⬤ Zakup książki w wersji drukowanej lub Kindle obejmuje bezpłatny eBook w formacie PDF.

Opis książki:

Nowoczesne architektury danych z Pythonem nauczą Cię, jak płynnie włączać strumienie pracy związane z uczeniem maszynowym i nauką o danych do otwartych platform danych. Dowiesz się, jak pobierać dane i tworzyć otwarte jeziora, które współpracują z dowolną technologią przy użyciu wypróbowanych i sprawdzonych technik, w tym architektury medalionu i Delta Lake.

Zaczynając od podstaw, ta książka pomoże ci zbudować potoki na Databricks, otwartej platformie danych, przy użyciu SQL i Pythona. Zapoznasz się z notatnikami i aplikacjami napisanymi w Pythonie przy użyciu standardowych narzędzi inżynierii oprogramowania, takich jak git, pre-commit, Jenkins i Github. Następnie zagłębisz się w strumieniowe i wsadowe przetwarzanie danych przy użyciu Apache Spark i Confluent Kafka. W miarę postępów dowiesz się, jak wdrażać zasoby przy użyciu infrastruktury jako kodu oraz jak zautomatyzować przepływy pracy i tworzenie kodu. Ponieważ zdolność każdej platformy danych do obsługi i pracy ze sztuczną inteligencją i uczeniem maszynowym jest istotnym elementem, poznasz również podstawy uczenia maszynowego i dowiesz się, jak pracować z nowoczesnymi narzędziami MLOps. Wreszcie, zdobędziesz praktyczne doświadczenie z Apache Spark, jedną z kluczowych technologii danych na dzisiejszym rynku.

Pod koniec tej książki zgromadzisz bogatą wiedzę praktyczną i teoretyczną do budowania, zarządzania, orkiestracji i architektury ekosystemów danych.

Czego się nauczysz:

⬤ Zrozumieć wzorce danych, w tym architekturę delta.

⬤ Odkryć, jak zwiększyć wydajność dzięki wewnętrznym elementom Sparka.

⬤ Dowiesz się, jak projektować krytyczne diagramy danych.

⬤ Poznaj MLOps za pomocą narzędzi takich jak AutoML i MLflow.

⬤ Zapoznanie się z tworzeniem produktów danych w siatce danych.

⬤ Odkryj zarządzanie danymi i zbuduj zaufanie do swoich danych.

⬤ Wprowadzić wizualizacje danych i pulpity nawigacyjne do swojej praktyki w zakresie danych.

Dla kogo jest ta książka:

Ta książka jest przeznaczona dla programistów, inżynierów analityków i menedżerów, którzy chcą dalej rozwijać ekosystem danych w swojej organizacji. Chociaż nie są to warunki wstępne, podstawowa znajomość języka Python i wcześniejsze doświadczenie z danymi pomogą w czytaniu i śledzeniu przykładów.

Dodatkowe informacje o książce:

ISBN:	9781801070492
Autor:	Brian Lipp
Wydawca:	Packt Pub
Język:	angielski
Oprawa:	Miękka oprawa

Zakup:

Obecnie dostępne, na stanie.

Nowoczesne architektury danych z Pythonem: Praktyczny przewodnik po budowaniu i wdrażaniu potoków danych, hurtowni danych i jezior danych w języku Python

Opinie czytelników

Oryginalny tytuł:

Zawartość książki:

Dodatkowe informacje o książce:

Zakup:

Inne książki autora:

Prace autora wydały następujące wydawnictwa: