Ocena:

Ta książka jest zalecana dla osób z pewnym wcześniejszym doświadczeniem w programowaniu, które chcą nauczyć się nauki o danych przy użyciu Pythona. Zapewnia kompleksowy przegląd przepływu pracy w nauce o danych, obejmujący takie tematy, jak czyszczenie danych, analiza eksploracyjna, techniki uczenia maszynowego i realizacja projektów. Książka zawiera praktyczne przykłady i studia przypadków, aby wzmocnić naukę, chociaż nie jest idealna dla początkujących lub ekspertów.
Zalety:⬤ Wypełnia lukę między teorią a praktycznym zastosowaniem nauki o danych.
⬤ Dokładne omówienie oczyszczania danych, analizy i tworzenia modeli.
⬤ Liczne praktyczne przykłady i studia przypadków.
⬤ Przystępne wyjaśnienia odpowiednie dla średnio zaawansowanych.
⬤ Dobrze skonstruowana struktura prowadząca czytelników przez cykl życia projektu nauki o danych.
⬤ Wymaga wcześniejszej znajomości programowania w Pythonie i niektórych statystyk.
⬤ Nieodpowiednia dla zupełnie początkujących lub doświadczonych naukowców zajmujących się danymi.
⬤ Brak szczegółowych wyjaśnień matematycznych dla niektórych pojęć.
⬤ Niektórzy czytelnicy mogą uznać skupienie się na pełnych projektach zamiast na mniejszych, indywidualnych ćwiczeniach za ograniczające.
(na podstawie 35 opinii czytelników)
Data Science Projects with Python - Second Edition: A case study approach to gaining valuable insights from real data with machine learning
Zdobądź praktyczne doświadczenie w programowaniu w języku Python z wykorzystaniem standardowych technik uczenia maszynowego przy użyciu pand, scikit-learn i XGBoost.
Kluczowe cechy:
⬤ Krytyczne myślenie o danych i wykorzystywanie ich do formułowania i testowania hipotez.
⬤ Wybór odpowiedniego modelu uczenia maszynowego i trenowanie go na danych.
⬤ Komunikuj spostrzeżenia oparte na danych z pewnością i jasnością.
Opis książki:
Jeśli dane są nową ropą, to uczenie maszynowe jest wiertłem. W miarę jak firmy uzyskują dostęp do coraz większych ilości nieprzetworzonych danych, zdolność do dostarczania najnowocześniejszych modeli predykcyjnych, które wspierają podejmowanie decyzji biznesowych, staje się coraz bardziej cenna.
W tej książce będziesz pracować nad kompleksowym projektem opartym na realistycznym zestawie danych i podzielonym na praktyczne ćwiczenia. Tworzy to podejście oparte na studium przypadku, które symuluje warunki pracy, jakich można doświadczyć w rzeczywistych projektach data science.
Nauczysz się korzystać z kluczowych pakietów Pythona, w tym pandas, Matplotlib i scikit-learn, a także opanujesz proces eksploracji i przetwarzania danych, zanim przejdziesz do dopasowywania, oceny i dostrajania algorytmów, takich jak regularna regresja logistyczna i losowy las.
Teraz, w drugim wydaniu, ta książka przeprowadzi Cię przez kompleksowy proces eksploracji danych i dostarczania modeli uczenia maszynowego. Zaktualizowane na 2021 r. wydanie zawiera zupełnie nowe treści na temat XGBoost, wartości SHAP, sprawiedliwości algorytmicznej i etycznych obaw związanych z wdrażaniem modelu w prawdziwym świecie.
Pod koniec tej książki o nauce o danych będziesz mieć umiejętności, zrozumienie i pewność siebie, aby tworzyć własne modele uczenia maszynowego i uzyskiwać wgląd w rzeczywiste dane.
Czego się nauczysz:
⬤ Ładować, eksplorować i przetwarzać dane przy użyciu pakietu pandas Python.
⬤ Używać Matplotlib do tworzenia atrakcyjnych wizualizacji danych.
⬤ Wdrażać predykcyjne modele uczenia maszynowego za pomocą scikit-learn.
⬤ Wykorzystanie regresji lasso i regresji grzbietowej w celu zmniejszenia nadmiernego dopasowania modelu.
⬤ Ocena wydajności modeli random forest i regresji logistycznej.
⬤ Dostarczanie informacji biznesowych poprzez przedstawianie jasnych, przekonujących wniosków.
Dla kogo jest ta książka:
Data Science Projects with Python - Second Edition jest przeznaczona dla każdego, kto chce rozpocząć swoją przygodę z nauką o danych i uczeniem maszynowym. Jeśli chcesz rozwijać swoją karierę, wykorzystując analizę danych i modelowanie predykcyjne do generowania spostrzeżeń biznesowych, ta książka jest idealnym miejscem do rozpoczęcia. Aby szybko zrozumieć omawiane koncepcje, zaleca się posiadanie podstawowego doświadczenia w programowaniu w Pythonie lub innym podobnym języku oraz ogólnego zainteresowania statystyką.