Pandas dla każdego: Analiza danych w Pythonie - przewodnik do opanowania analizy danych

Pandy dla każdego: Analiza danych w Pythonie (Daniel Chen)

Opinie czytelników

Podsumowanie:

Ogólnie rzecz biorąc, recenzje podkreślają, że książka jest praktycznym wprowadzeniem do Pandas, szczególnie cennym dla początkujących i tych, którzy chcą szybko zastosować umiejętności analizy danych. Na pochwałę zasługują jasne wyjaśnienia i praktyczne przykłady, choć niektóre krytyki koncentrują się na przestarzałej treści, kwestiach formatowania i obecności materiałów wypełniających. Czytelnicy uważają, że jest ona mniej wszechstronna w porównaniu do innych książek o Pandas.

Zalety:

⬤ Przejrzyste wyjaśnienia i praktyczne przykłady, które pomagają zrozumieć.
⬤ Praktyczne zastosowania w analizie danych, szczególnie przydatne w zadaniach związanych z pracą.
⬤ Dobry materiał wprowadzający dla początkujących i studentów.
⬤ Zasoby towarzyszące, takie jak notatniki GitHub, zapewniają dalsze wsparcie.
⬤ Zwięzły i bezpośrednio odnosi się do potrzeb użytkownika bez nadmiernej szczegółowości.

Wady:

⬤ Zawiera literówki i nieaktualne informacje; niektórzy zalecają sprawdzenie najnowszego wydania.
⬤ Niektórzy recenzenci uważają, że formatowanie i użycie materiałów wypełniających obniża jakość treści.
⬤ Brak głębi w niektórych metodach i tematach w porównaniu do innych materiałów referencyjnych Pandas.
⬤ Wymaga zewnętrznego wysiłku, aby uzyskać dostęp do przykładów podanych w tekście.
⬤ Niektórzy uważają, że nie nadaje się do dogłębnych badań.

(na podstawie 69 opinii czytelników)

Oryginalny tytuł:

Pandas for Everyone: Python Data Analysis

Zawartość książki:

Praktyczne, bogate w przykłady wprowadzenie do analizy danych Pandas w Pythonie.

W dzisiejszych czasach analitycy muszą zarządzać danymi charakteryzującymi się niezwykłą różnorodnością, szybkością i objętością. Korzystając z otwartej biblioteki Pandas, możesz użyć Pythona do szybkiej automatyzacji i wykonania praktycznie każdego zadania analizy danych, bez względu na to, jak duże i złożone. Pandas może pomóc zapewnić prawdziwość danych, wizualizować je w celu skutecznego podejmowania decyzji i niezawodnie odtwarzać analizy w wielu zestawach danych.

Pandas dla każdego łączy w sobie praktyczną wiedzę i wgląd w rozwiązywanie rzeczywistych problemów za pomocą Pandas, nawet jeśli jesteś nowy w analizie danych w Pythonie. Daniel Y. Chen wprowadza kluczowe koncepcje za pomocą prostych, ale praktycznych przykładów, stopniowo rozwijając je w celu rozwiązania trudniejszych, rzeczywistych problemów.

Chen daje ci szybki start w korzystaniu z Pandas z realistycznym zestawem danych i obejmuje łączenie zestawów danych, obsługę brakujących danych i strukturyzację zestawów danych w celu łatwiejszej analizy i wizualizacji. Demonstruje potężne techniki czyszczenia danych, od podstawowej manipulacji ciągami znaków po jednoczesne stosowanie funkcji w ramkach danych.

Gdy dane są już gotowe, Chen prowadzi użytkownika przez dopasowywanie modeli do przewidywania, grupowania, wnioskowania i eksploracji. Podaje wskazówki dotyczące wydajności i skalowalności, a także wprowadza do szerszego ekosystemu analizy danych w Pythonie.

⬤ Praca z DataFrames i Series oraz importowanie i eksportowanie danych.

⬤ Tworzenie wykresów za pomocą matplotlib, seaborn i pandas.

⬤ Łączenie zestawów danych i obsługa brakujących danych.

⬤ Kształtowanie, porządkowanie i czyszczenie zestawów danych w celu ułatwienia pracy z nimi.

⬤ Konwersja typów danych i manipulowanie ciągami tekstowymi.

⬤ Stosowanie funkcji do skalowania manipulacji danymi.

⬤ Grupuj, przekształcaj i filtruj duże zbiory danych za pomocą groupby.

⬤ Wykorzystanie zaawansowanych możliwości Pandas w zakresie daty i czasu.

⬤ Dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn.

⬤ Wykorzystanie uogólnionego modelowania liniowego do dopasowania modeli z różnymi zmiennymi odpowiedzi.

⬤ Porównywanie wielu modeli w celu wybrania "najlepszego".

⬤ Regularyzacja w celu przezwyciężenia nadmiernego dopasowania i poprawy wydajności.

⬤ Wykorzystanie klastrowania w nienadzorowanym uczeniu maszynowym.

Dodatkowe informacje o książce:

ISBN:	9780134546933
Autor:	Daniel Chen
Wydawca:	Addison Wesley Pub Co Inc
Oprawa:	Miękka oprawa
Rok wydania:	2018
Liczba stron:	416

Zakup:

Obecnie dostępne, na stanie.

Pandy dla każdego: Analiza danych w Pythonie

Opinie czytelników

Oryginalny tytuł:

Zawartość książki:

Dodatkowe informacje o książce:

Zakup:

Inne książki autora:

Prace autora wydały następujące wydawnictwa: