Warsztat zarządzania danymi, wydanie drugie: Twórz własne, przydatne spostrzeżenia, wykorzystując dane z wielu nieprzetworzonych źródeł

Ocena:   (4,6 na 5)

Warsztat zarządzania danymi, wydanie drugie: Twórz własne, przydatne spostrzeżenia, wykorzystując dane z wielu nieprzetworzonych źródeł (Brian Lipp)

Opinie czytelników

Podsumowanie:

Książka jest wysoce zalecanym źródłem informacji dla początkujących w nauce o danych, w szczególności w zarządzaniu danymi. Oferuje praktyczne, praktyczne podejście ze szczegółowymi wyjaśnieniami i przykładami. Podczas gdy podstawowa treść i struktura są dobrze przyjęte, kilku czytelników zauważyło obecność literówek i błędów, które mogą zmylić początkujących użytkowników.

Zalety:

Dokładne wyjaśnienia kodu, budujące intuicję dla początkujących.
Kompleksowe omówienie struktur danych, modułów i technik istotnych dla zarządzania danymi.
Praktyczne ćwiczenia i zasoby do pobrania zwiększają komfort nauki.
Zawiera praktyczne przypadki użycia i przykłady ilustrujące koncepcje.
Odpowiedni zarówno dla początkujących, jak i tych, którzy chcą odświeżyć swoje umiejętności.

Wady:

Obecność literówek i błędów w przykładach, które mogą frustrować początkujących.
Książka koncentruje się na praktycznych zastosowaniach („co jest”), a nie na teoretycznych wyjaśnieniach („dlaczego tak jest”).

(na podstawie 11 opinii czytelników)

Oryginalny tytuł:

The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources

Zawartość książki:

Przewodnik dla początkujących, jak uprościć procesy wyodrębniania, przekształcania i ładowania (ETL) za pomocą praktycznych wskazówek, sztuczek i najlepszych praktyk, w zabawny i interaktywny sposób.

Kluczowe cechy

⬤ Zapoznaj się z przetwarzaniem danych za pomocą rzeczywistych przykładów i przypadków użycia w biznesie.

⬤ Poznaj różne sposoby na wydobycie jak największej wartości z danych w jak najkrótszym czasie.

⬤ Wzbogać swoją wiedzę dzięki dodatkowym tematom, takim jak losowe generowanie danych i sprawdzanie integralności danych.

Opis książki

Chociaż ogromne ilości danych są dla nas łatwo dostępne, nie są one użyteczne w swojej surowej postaci. Aby dane miały znaczenie, muszą zostać poddane selekcji i dopracowane.

Jeśli jesteś początkującym, to The Data Wrangling Workshop pomoże ci przełamać ten proces. Zaczniesz od podstaw i zbudujesz swoją wiedzę, przechodząc od podstawowych aspektów związanych z porządkowaniem danych, do korzystania z najpopularniejszych narzędzi i technik.

Ta książka zaczyna się od pokazania, jak pracować ze strukturami danych przy użyciu Pythona. Dzięki przykładom i ćwiczeniom zrozumiesz, dlaczego powinieneś trzymać się z dala od tradycyjnych metod czyszczenia danych stosowanych w innych językach i skorzystać z wyspecjalizowanych, gotowych procedur w Pythonie. Później dowiesz się, jak używać tego samego backendu Pythona do wyodrębniania i przekształcania danych z szeregu źródeł, w tym z Internetu, dużych baz danych i tabel finansowych Excela. Aby pomóc ci przygotować się na trudniejsze scenariusze, książka uczy, jak radzić sobie z brakującymi lub niepoprawnymi danymi i przeformatowywać je w oparciu o wymagania narzędzia analitycznego.

Pod koniec tej książki rozwiniesz solidne zrozumienie tego, jak wykonywać przetwarzanie danych za pomocą Pythona, a także nauczysz się kilku technik i najlepszych praktyk, aby skutecznie wyodrębniać, czyścić, przekształcać i formatować dane z różnych źródeł.

Czego się nauczysz

⬤ Zapoznać się z podstawami zarządzania danymi.

⬤ Zrozumieć, jak modelować dane za pomocą losowego generowania danych i kontroli integralności danych.

⬤ Dowiesz się, jak badać dane za pomocą statystyk opisowych i technik tworzenia wykresów.

⬤ Dowiedz się, jak wyszukiwać i pobierać informacje za pomocą wyrażeń regularnych.

⬤ Zagłębić się w powszechnie używane biblioteki Pythona do nauki o danych.

⬤ Zapoznanie się ze sposobami obsługi i kompensacji brakujących danych.

Dla kogo jest ta książka

The Data Wrangling Workshop jest przeznaczony dla programistów, analityków danych i analityków biznesowych, którzy chcą kontynuować karierę jako pełnoprawny naukowiec danych lub ekspert ds. analityki. Mimo że książka ta jest przeznaczona dla początkujących, którzy chcą rozpocząć pracę z danymi, wcześniejsza znajomość języka programowania Python jest niezbędna do łatwego zrozumienia omawianych tu koncepcji. Pomocna będzie również podstawowa znajomość relacyjnych baz danych i języka SQL.

Dodatkowe informacje o książce:

ISBN:9781839215001
Autor:
Wydawca:
Oprawa:Miękka oprawa

Zakup:

Obecnie dostępne, na stanie.

Inne książki autora:

Warsztat zarządzania danymi, wydanie drugie: Twórz własne, przydatne spostrzeżenia, wykorzystując...
Przewodnik dla początkujących, jak uprościć...
Warsztat zarządzania danymi, wydanie drugie: Twórz własne, przydatne spostrzeżenia, wykorzystując dane z wielu nieprzetworzonych źródeł - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Nowoczesne architektury danych z Pythonem: Praktyczny przewodnik po budowaniu i wdrażaniu potoków...
Tworzenie skalowalnych i niezawodnych ekosystemów...
Nowoczesne architektury danych z Pythonem: Praktyczny przewodnik po budowaniu i wdrażaniu potoków danych, hurtowni danych i jezior danych w języku Python - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Prace autora wydały następujące wydawnictwa:

© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)