Ocena:

Obecnie brak opinii czytelników. Ocena opiera się na 9 głosach.
Pandas for Everyone: Python Data Analysis
Praktyczne, bogate w przykłady wprowadzenie do analizy danych Pandas w Pythonie.
W dzisiejszych czasach analitycy muszą zarządzać danymi charakteryzującymi się niezwykłą różnorodnością, szybkością i objętością. Korzystając z otwartej biblioteki Pandas, możesz użyć Pythona do szybkiej automatyzacji i wykonania praktycznie każdego zadania analizy danych, bez względu na to, jak duże i złożone. Pandas może pomóc zapewnić prawdziwość danych, wizualizować je w celu skutecznego podejmowania decyzji i niezawodnie odtwarzać analizy w wielu zestawach danych.
Pandas dla każdego łączy w sobie praktyczną wiedzę i wgląd w rozwiązywanie rzeczywistych problemów za pomocą Pandas, nawet jeśli jesteś nowy w analizie danych w Pythonie. Daniel Y. Chen wprowadza kluczowe koncepcje za pomocą prostych, ale praktycznych przykładów, stopniowo rozwijając je w celu rozwiązania trudniejszych, rzeczywistych problemów.
Chen daje ci szybki start w korzystaniu z Pandas z realistycznym zestawem danych i obejmuje łączenie zestawów danych, obsługę brakujących danych i strukturyzację zestawów danych w celu łatwiejszej analizy i wizualizacji. Demonstruje potężne techniki czyszczenia danych, od podstawowej manipulacji ciągami znaków po jednoczesne stosowanie funkcji w ramkach danych.
Gdy dane są już gotowe, Chen prowadzi użytkownika przez dopasowywanie modeli do przewidywania, grupowania, wnioskowania i eksploracji. Podaje wskazówki dotyczące wydajności i skalowalności, a także wprowadza do szerszego ekosystemu analizy danych w Pythonie.
⬤ Praca z DataFrames i Series oraz importowanie i eksportowanie danychTworzenie wykresów za pomocą matplotlib, seaborn i pandas.
⬤ Łączenie zestawów danych i obsługa brakujących danych.
⬤ Kształtowanie, porządkowanie i czyszczenie zestawów danych, aby ułatwić pracę z nimi.
⬤ Konwersja typów danych i manipulowanie ciągami tekstowymi.
⬤ Stosowanie funkcji do skalowania manipulacji danymi.
⬤ Grupuj, przekształcaj i filtruj duże zbiory danych za pomocą groupby.
⬤ Wykorzystanie zaawansowanych możliwości Pandas w zakresie daty i czasu.
⬤ Dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn.
⬤ Wykorzystanie uogólnionego modelowania liniowego do dopasowania modeli z różnymi zmiennymi odpowiedzi.
⬤ Porównywanie wielu modeli w celu wybrania najlepszego.
⬤ Regularyzacja w celu przezwyciężenia nadmiernego dopasowania i poprawy wydajności.
⬤ Wykorzystanie klastrowania w nienadzorowanym uczeniu maszynowym.
⬤ .