Ocena:
Obecnie brak opinii czytelników. Ocena opiera się na 2 głosach.
Data Science Revealed: With Feature Engineering, Data Visualization, Pipeline Development, and Hyperparameter Tuning
Sekcja 1: Metody parametryczneRozdział 1: Wprowadzenie do prostej regresji liniowejCel rozdziału: Wprowadzenie czytelnika do metod parametrycznych i zrozumienie podstawowych założeń regresji. Podtematy - Założenia regresji. - Wykrywanie brakujących wartości. - Analiza opisowa. - Zrozumienie korelacji. o Wykreślenie macierzy korelacji Pearsona. - Określanie kowariancji. o Wykreślanie macierzy kowariancji. - Tworzenie i przekształcanie tablic. - Dzielenie danych na treningowe i testowe. - Normalizacja danych. - Znajdowanie najlepszych hiper-parametrów dla modelu. - Tworzenie własnego modelu. - Przegląd wydajności modelu. o Średni błąd bezwzględny. o Średni błąd kwadratowy. o Średni błąd pierwiastka kwadratowego. o R-kwadrat. o Wykres wartości rzeczywistych w stosunku do wartości przewidywanych. - Diagnoza rezydualna. o Normalny wykres Q-Q. o Wykres wpływu D Cooka. o Wykres wartości przewidywanych vs. wartości rezydualne. o Wykres wartości dopasowanych vs. wartości rezydualne. o Wykres wartości dźwigni vs. wartości rezydualne. o Wykres wartości dopasowanych vs. przestudiowane wartości rezydualne. o Wykres wartości dźwigni vs. przestudiowane wartości rezydualne.
Rozdział 2: Zaawansowane metody parametryczneCel rozdziału: Najważniejsze metody radzenia sobie z problemem niedopasowania i nadmiernego dopasowania. Podtematy - Kwestia współliniowości. - Poznanie metod radzenia sobie z problemem niedopasowania i nadmiernego dopasowania. - Zrozumienie modeli regresji Ridge, RidgeCV i Lasso. - Znalezienie najlepszych hiper-parametrów dla modelu. - Tworzenie regularnych modeli. - Porównywanie wydajności różnych metod regresji. o Średni błąd bezwzględny. o Średni błąd kwadratowy. o Średni błąd pierwiastka kwadratowego. o R-kwadrat. o Wykresowanie wartości rzeczywistych względem wartości przewidywanych.
Rozdział 3: Analiza szeregów czasowychCel rozdziału: Obejmuje model identyfikacji trendów i wzorców w danych sekwencyjnych oraz sposób prognozowania szeregów. - Czym jest analiza szeregów czasowych? - Podstawowe założenia analizy szeregów czasowych. - Różne rodzaje modeli analizy szeregów czasowych. - Model ARIMA. - Test stacjonarności. o Przeprowadzenie testu ADF Fullera. - Test białego szumu. - Test korelacji. o Wykres opóźnienia. o Wykres opóźnienia vs. wykres autokorelacji. o Wykres ACF. o Wykres PACF. - Zrozumienie trendów, sezonowości i trendów. o Wykreślenie komponentów sezonowych. - Wygładzanie szeregów czasowych przy użyciu technik średniej ruchomej, odchylenia standardowego i wykładniczego. o Wykreślanie wygładzonych szeregów czasowych. - Określanie stopy zwrotu i kroczącej stopy zwrotu. - Określanie parametrów modelu ARIMA. - Budowa modelu ARIMA. - Prognoza ARIMA. o Wykreśl prognozę. - Diagnoza resztowa.
Rozdział 4: Wysoka jakość szeregów czasowychCel rozdziału: Eksploracja Prophet dla lepszej prognozy szeregów czasowych. - Różnica między modelem statystycznym a Prophet. - Zrozumienie komponentów w Prophet. - Wstępne przetwarzanie danych. - Opracowanie modelu przy użyciu Prophet. - Prognozowanie serii. o Wykreślanie prognoz. o Wykreślanie komponentów sezonowych. - Ocena wydajności modelu przy użyciu Prophet. Rozdział 4: Regresja logistycznaCel rozdziału: Wprowadzenie do regresji logistycznej - potężnego modelu klasyfikacji. Podtematy - Znajdowanie brakujących wartości.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)