Ocena:
Książka „Querying Databricks with Spark SQL” oferuje dokładne omówienie zarówno podstawowych, jak i zaawansowanych koncepcji Spark SQL. Jest dobrze skonstruowana, zawiera scenariusze biznesowe wprowadzające zapytania SQL i zapewnia jasne wyjaśnienia. Niektórzy czytelnicy mieli jednak problemy z instrukcjami i organizacją.
Zalety:⬤ Kompleksowe omówienie Spark SQL, odpowiednie zarówno dla początkujących, jak i zaawansowanych użytkowników
⬤ przejrzysta struktura i wyjaśnienia
⬤ dobrze zaprojektowana przykładowa baza danych
⬤ cenna sekcja „Sztuczki i pułapki”
⬤ satysfakcjonująca lektura dla profesjonalistów SQL poszukujących zaawansowanych tematów.
⬤ Instrukcje dotyczące konfiguracji zestawu danych były niejasne
⬤ zasoby GitHub były źle zorganizowane
⬤ jakość oprawy książki mogłaby zostać poprawiona
⬤ pominięte tematy, takie jak instrukcje SQL MERGE, UPDATE, DELETE
⬤ początkowa czkawka z instrukcjami importu pliku danych.
(na podstawie 2 opinii czytelników)
Querying Databricks with Spark SQL
Praktyczny przewodnik po używaniu Spark SQL do wykonywania złożonych zapytań na danych Databricks
Główne cechy
Nauka SQL od podstaw, bez konieczności wcześniejszego programowania lub znajomości SQL.
Stopniowe budowanie wiedzy i umiejętności, od podstawowych zapytań o dane do złożonych analiz.
Zdobądź praktyczne doświadczenie z SQL, obejmujące wszystkie poziomy wiedzy, od początkującego do eksperta.
Opis
Databricks wyróżnia się jako szeroko rozpowszechniona platforma dedykowana do tworzenia jezior danych. W swojej strukturze rozszerza wsparcie dla wyspecjalizowanej wersji Structured Query Language (SQL) znanej jako Spark SQL. Jeśli chcesz dowiedzieć się więcej o tym, jak używać Spark SQL do analizy danych w data lake, ta książka jest dla Ciebie.
Książka obejmuje wszystko, od podstawowych zapytań po złożone zadania przetwarzania danych. Rozpoczyna się od wprowadzenia do SQL i Spark. Następnie omówiono podstawy języka SQL, w tym typy danych, operatory i klauzule. Kolejne rozdziały skupiają się na filtrowaniu, agregacji i obliczeniach. Ponadto omówiono daty i godziny, formatowanie danych wyjściowych i używanie logiki w zapytaniach. Omówiono także łączenie tabel, podzapytania, tabele pochodne i typowe wyrażenia tabelaryczne. Ponadto omówiono skorelowane podzapytania, łączenie i filtrowanie zestawów danych, używanie SQL w obliczeniach, segmentowanie i klasyfikowanie danych, analizę kroczącą i analizę danych w czasie. Książka kończy się rozdziałem poświęconym zaawansowanej prezentacji danych.
Pod koniec książki będziesz w stanie używać Spark SQL do wykonywania złożonych zadań analizy danych na jeziorach danych.
Czego się nauczysz
Używać Spark SQL do odczytu danych z jeziora danych.
Jak filtrować, agregować i obliczać dane przy użyciu Spark SQL.
Dowiedz się, jak łączyć tabele, używać podzapytań i tworzyć tabele pochodne w Spark SQL.
Analizuj dane w czasie za pomocą Spark SQL, aby śledzić trendy i identyfikować wzorce w danych.
Prezentuj dane w atrakcyjny wizualnie sposób za pomocą Spark SQL.
Dla kogo przeznaczona jest ta książka
Ta książka jest przeznaczona dla każdego, kto chce nauczyć się używać SQL do analizy dużych zbiorów danych. Niezależnie od tego, czy jesteś analitykiem danych, studentem, programistą baz danych, księgowym, analitykiem biznesowym, analitykiem danych, czy kimkolwiek innym, kto musi wydobyć wgląd z dużych zbiorów danych, ta książka nauczy Cię umiejętności potrzebnych do wykonania zadania.
Spis treści
1. Pisanie podstawowych zapytań SQL
2. Filtrowanie danych
3. Stosowanie złożonych filtrów do zapytań
4. Proste obliczenia
5. Agregacja danych wyjściowych
6. Praca z datami w Databricks
7. Formatowanie tekstu w danych wyjściowych zapytania
8. Formatowanie liczb i dat
9. Korzystanie z podstawowej logiki w celu usprawnienia analizy
10. Korzystanie z wielu tabel podczas wyszukiwania danych
11. Korzystanie z zaawansowanych złączeń tabel
12. Podzapytania
13. Tabele pochodne
14. Typowe wyrażenia tabelaryczne
15. Skorelowane podzapytania
16. Manipulacja zestawami danych
17. Używanie SQL do bardziej zaawansowanych obliczeń
18. Segmentacja i klasyfikacja danych
19. Analiza krocząca
20. Analiza danych w czasie
21. Złożone dane wyjściowe
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)