Ocena:

Obecnie brak opinii czytelników. Ocena opiera się na 33 głosach.
Data Wrangling with Python
Uprość swoje procesy ETL dzięki tym praktycznym wskazówkom, sztuczkom i najlepszym praktykom w zakresie higieny danych. Kluczowe cechy Skoncentruj się na podstawach zarządzania danymi Zbadaj różne sposoby, aby wydobyć jak najwięcej z danych w krótszym czasie Zwiększ swoją krzywą uczenia się dzięki dodatkowym tematom, takim jak losowe generowanie danych i kontrole integralności danych Opis książki
Aby dane były użyteczne i znaczące, muszą być wyselekcjonowane i dopracowane. Data Wrangling with Python uczy podstawowych idei stojących za tymi procesami i wyposaża w wiedzę na temat najpopularniejszych narzędzi i technik w tej dziedzinie.
Książka zaczyna się od absolutnych podstaw Pythona, koncentrując się głównie na strukturach danych. Następnie zagłębia się w podstawowe narzędzia przetwarzania danych, takie jak biblioteki NumPy i Pandas. Poznasz przydatne spostrzeżenia na temat tego, dlaczego powinieneś trzymać się z dala od tradycyjnych sposobów czyszczenia danych, tak jak ma to miejsce w innych językach, i skorzystać z wyspecjalizowanych, gotowych procedur w Pythonie. Ta kombinacja wskazówek i sztuczek Pythona pokaże również, jak korzystać z tego samego backendu Pythona i wyodrębniać / przekształcać dane z szeregu źródeł, w tym z Internetu, dużych skarbców baz danych i tabel finansowych Excela. Aby pomóc ci przygotować się na trudniejsze scenariusze, dowiesz się, jak radzić sobie z brakującymi lub nieprawidłowymi danymi i przeformatować je w oparciu o wymagania narzędzia analitycznego. Książka dodatkowo pomoże ci zrozumieć koncepcje poprzez rzeczywiste przykłady i zestawy danych.
Pod koniec tej książki będziesz mieć pewność, że korzystasz z różnorodnych źródeł w celu wydajnego wyodrębniania, czyszczenia, przekształcania i formatowania danych. Czego się nauczysz Używaj i manipuluj złożonymi i prostymi strukturami danych Wykorzystaj pełny potencjał DataFrames i numpy. array w czasie wykonywania Wykonuj skrobanie stron internetowych za pomocą BeautifulSoup4 i html5lib Wykonuj zaawansowane wyszukiwanie ciągów znaków i manipulowanie nimi za pomocą RegEX Obsługuj wartości odstające i wykonuj imputację danych za pomocą Pandas Używaj statystyk opisowych i technik tworzenia wykresów Ćwicz zarządzanie danymi i modelowanie za pomocą technik generowania danych Dla kogo jest ta książka?
Data Wrangling with Python jest przeznaczony dla programistów, analityków danych i analityków biznesowych, którzy chcą kontynuować karierę jako pełnoprawny analityk danych lub ekspert ds. analityki. Mimo że książka ta przeznaczona jest dla początkujących, wcześniejsza znajomość języka Python jest niezbędna do łatwego zrozumienia omawianych tu koncepcji. Pomocna będzie również podstawowa znajomość relacyjnych baz danych i języka SQL. Spis treści Wprowadzenie do zarządzania danymi w Pythonie Zaawansowane struktury danych i obsługa plików Wprowadzenie do Numpy, Pandas i Matplotlib Dogłębne zapoznanie się z zarządzaniem danymi w Pythonie Uzyskanie komfortu pracy z różnymi rodzajami źródeł danych Poznanie ukrytych sekretów zarządzania danymi Zaawansowane skrobanie stron internetowych i gromadzenie danych RDBMS i SQL Zastosowanie zarządzania danymi w prawdziwym życiu