Ocena:

Książka ta jest dobrze oceniana przez użytkowników ze względu na jej przejrzystość i przydatność w nauce języka Python do nauki danych, odpowiednią zarówno dla początkujących, jak i średnio zaawansowanych programistów. Oferuje praktyczne przykłady i ćwiczenia, choć niektórzy użytkownicy uznali ją za frustrującą ze względu na jakość druku i błędy programistyczne.
Zalety:⬤ Przejrzysty i zwięzły
⬤ świetny dla początkujących i średnio zaawansowanych
⬤ praktyczne przykłady
⬤ pomocny w nauce koncepcji nauki o danych
⬤ kończy się ćwiczeniami ułatwiającymi zrozumienie
⬤ nadaje się jako podręcznik.
⬤ Wydrukowano w czerni i bieli, co wpływa na przejrzystość wykresów
⬤ niektóre fragmenty kodu nie działają poprawnie
⬤ kwestie pedagogiczne
⬤ wymaga wcześniejszej znajomości Pythona dla optymalnego zrozumienia.
(na podstawie 9 opinii czytelników)
Data Science Essentials in Python: Collect - Organize - Explore - Predict - Value
Przejdź od nieuporządkowanych, nieustrukturyzowanych artefaktów przechowywanych w bazach danych SQL i NoSQL do schludnego, dobrze zorganizowanego zbioru danych dzięki temu szybkiemu źródłu informacji dla zapracowanych naukowców zajmujących się danymi. Zrozum eksplorację tekstu, uczenie maszynowe i analizę sieci; przetwarzaj dane numeryczne za pomocą modułów NumPy i Pandas; opisuj i analizuj dane za pomocą metod statystycznych i sieciowo-teoretycznych; i zobacz rzeczywiste przykłady analizy danych w pracy. To kompleksowe rozwiązanie obejmuje niezbędną naukę o danych w Pythonie.
Nauka o danych jest jedną z najszybciej rozwijających się dyscyplin pod względem badań akademickich, rekrutacji studentów i zatrudnienia. Python, dzięki swojej elastyczności i skalowalności, szybko wyprzedza język R w projektach związanych z nauką o danych. Zachowaj koncepcje nauki o danych w Pythonie na wyciągnięcie ręki dzięki temu modułowemu, szybkiemu odnośnikowi do narzędzi używanych do pozyskiwania, czyszczenia, analizowania i przechowywania danych.
To kompleksowe rozwiązanie obejmuje niezbędny Python, bazy danych, analizę sieci, przetwarzanie języka naturalnego, elementy uczenia maszynowego i wizualizację. Uzyskaj dostęp do ustrukturyzowanych i nieustrukturyzowanych danych tekstowych i numerycznych z plików lokalnych, baz danych i Internetu. Porządkowanie, zmiana układu i czyszczenie danych. Praca z relacyjnymi i nierelacyjnymi bazami danych, wizualizacja danych i prosta analiza predykcyjna (regresja, grupowanie i drzewa decyzyjne). Zobacz, jak rozwiązywane są typowe problemy związane z analizą danych. I spróbuj swoich sił w tworzeniu własnych rozwiązań dla różnych projektów na średnią skalę, nad którymi przyjemnie się pracuje i które dobrze wyglądają w CV.
Zachowaj ten podręczny krótki przewodnik przy sobie, niezależnie od tego, czy jesteś studentem, początkującym specjalistą w dziedzinie nauki o danych konwertującym z R na Python, czy też doświadczonym programistą Pythona, który nie chce zapamiętywać każdej funkcji i opcji.
Czego potrzebujesz:
Potrzebna jest przyzwoita dystrybucja Pythona 3. 3 lub wyższej, która zawiera co najmniej NLTK, Pandas, NumPy, Matplotlib, Networkx, SciKit-Learn i BeautifulSoup. Świetną dystrybucją spełniającą te wymagania jest Anaconda, dostępna za darmo na stronie www.continuum. io. Jeśli planujesz skonfigurować własne serwery baz danych, potrzebujesz również MySQL (www.mysql.com) i MongoDB (www.mongodb.com). Oba pakiety są darmowe i działają w systemach Windows, Linux i Mac OS.