Ocena:

Książka jest chwalona za przystępne wprowadzenie do statystyki i praktyczne skupienie się na metodach wnioskowania opartych na symulacji, szczególnie dla początkujących i aspirujących badaczy danych korzystających z R i Tidyverse. Choć jest ona ceniona za praktyczne podejście, niektórzy recenzenci krytykują jakość druku i brak zwięzłych przykładów implementacji testów statystycznych.
Zalety:⬤ Przystępne wprowadzenie do statystyki dla początkujących i aspirujących badaczy danych.
⬤ Kładzie nacisk na praktyczną, praktyczną naukę z rzeczywistymi zastosowaniami.
⬤ Skupia się na wnioskowaniu opartym na symulacji, dobrze łącząc się z R i Tidyverse.
⬤ Zapewnia jasne wyjaśnienia i doskonałe narzędzia, w tym pakiet „infer”.
⬤ Zachęca do eksploracji i zrozumienia koncepcji statystycznych poprzez wielokrotne odniesienia i praktyczne przykłady.
⬤ Jakość druku jest krytykowana jako słaba, przypominająca „jakość kserokopiarki”.
⬤ Niektórzy uznali książkę za zwodniczo trudną i pozbawioną zwięzłych przykładów implementacji różnych testów statystycznych.
⬤ Kilku recenzentów zauważyło, że książka może być bardziej odpowiednia dla uczniów szkół średnich lub studentów wczesnych lat studiów niż dla zaawansowanych uczniów.
⬤ Jeden z recenzentów wspomniał o chęci szerszego omówienia metodologii statystycznych i kompromisów.
(na podstawie 9 opinii czytelników)
Statistical Inference via Data Science: A ModernDive into R and the Tidyverse
Statistical Inference via Data Science: A ModernDive into R and the Tidyverse zapewnia ścieżkę do poznania wnioskowania statystycznego przy użyciu narzędzi nauki o danych szeroko stosowanych w przemyśle, środowisku akademickim i rządowym. Wprowadza pakiet tidyverse pakietów R, w tym pakiet ggplot2 do wizualizacji danych i pakiet dplyr do przetwarzania danych. Po wyposażeniu czytelników w wystarczającą ilość tych narzędzi do nauki o danych, aby przeprowadzić skuteczne analizy danych eksploracyjnych, książka obejmuje tradycyjne tematy statystyki wprowadzającej, takie jak przedziały ufności, testowanie hipotez i modelowanie regresji wielokrotnej, koncentrując się jednocześnie na wizualizacji.
Cechy:
Zakłada minimalne wymagania wstępne, w szczególności brak wcześniejszego rachunku różniczkowego lub doświadczenia w kodowaniu.
Motywuje teorię przy użyciu rzeczywistych danych, w tym wszystkich lotów krajowych opuszczających Nowy Jork w 2013 r., projektu Gapminder i strony internetowej dziennikarstwa danych, FiveThirtyEight.com.
Koncentruje się na symulacyjnym podejściu do wnioskowania statystycznego, a nie na formułach matematycznych.
Wykorzystuje pakiet infer do "uporządkowanego" i przejrzystego wnioskowania statystycznego w celu konstruowania przedziałów ufności i przeprowadzania testów hipotez za pomocą metod bootstrap i permutacji.
Zapewnia cały kod i dane wyjściowe osadzone bezpośrednio w tekście; dostępne również w wersji online na moderndive.com.
Ta książka jest przeznaczona dla osób, które chciałyby jednocześnie zacząć rozwijać swój zestaw narzędzi do nauki o danych i rozpocząć naukę o narzędziach wnioskowania i modelowania stosowanych w wielu współczesnych badaniach. Książka może być wykorzystywana na kursach metod i nauki o danych oraz na pierwszych kursach statystyki, zarówno na poziomie licencjackim, jak i magisterskim.