Ocena:

Książka została doceniona za przejrzystość i przydatność w czyszczeniu danych, z naciskiem na uczenie się na przykładach. Jest jednak krytykowana za wysoką cenę, brak wsparcia online dla zestawów danych i drobne problemy z jakością druku.
Zalety:Łatwa w czytaniu, dobre odniesienie do kursów czyszczenia danych, dobrze szczegółowa, zorientowana na przykłady z fragmentami kodu.
Wady:Droga jak na swoją długość, niewyraźna jakość druku na niektórych stronach, brak wsparcia online dla zbiorów danych, brak dostępu do powiązanych kodów i zbiorów danych, pominięcie trudnych kroków.
(na podstawie 6 opinii czytelników)
Data Science Using Python and R
Nauka o danych poprzez naukę o danych
Nauka o danych przy użyciu Pythona i Rpozwoli ci zapoznać się z dwiema najbardziej rozpowszechnionymi na świecie platformami open source do nauki o danych: Python i R.
Nauka o danych jest gorąca. Bloomberg nazwał specjalistę ds. danych "najgorętszą pracą w Ameryce". Python i R to dwa najpopularniejsze narzędzia open source do nauki o danych na świecie. W książce Data Science Using Python and R dowiesz się krok po kroku, jak tworzyć praktyczne rozwiązania rzeczywistych problemów biznesowych przy użyciu najnowocześniejszych technik.
Data Science Using Python and R zostało napisane z myślą o czytelnikach nieposiadających wcześniejszego doświadczenia w analityce lub programowaniu. Cały rozdział poświęcony jest nauce podstaw Pythona i R. Następnie, każdy rozdział przedstawia instrukcje krok po kroku i instrukcje rozwiązywania problemów związanych z nauką o danych przy użyciu Pythona i R.
Osoby z doświadczeniem w analityce z pewnością docenią fakt, że w jednym miejscu mogą nauczyć się, jak korzystać z Pythona i R. Poruszane tematy obejmują przygotowanie danych, eksploracyjną analizę danych, przygotowanie do modelowania danych, drzewa decyzyjne, ocenę modeli, koszty błędnej klasyfikacji, klasyfikację bayesowską, sieci neuronowe, klastrowanie, modelowanie regresji, redukcję wymiarów i eksplorację reguł asocjacyjnych.
Ponadto uwzględniono nowe, ekscytujące tematy, takie jak lasy losowe i ogólne modele liniowe. Książka kładzie nacisk na koszty błędów oparte na danych w celu zwiększenia rentowności, co pozwala uniknąć typowych pułapek, które mogą kosztować firmę miliony dolarów.
Data Science Using Python and R zapewnia ćwiczenia na końcu każdego rozdziału, w sumie ponad 500 ćwiczeń w książce. Czytelnicy będą więc mieli wiele okazji do przetestowania swoich nowo nabytych umiejętności i wiedzy z zakresu nauki o danych. W ćwiczeniach Hands-on Analysis czytelnicy mają za zadanie rozwiązać interesujące problemy biznesowe przy użyciu rzeczywistych zestawów danych.