Ocena:
Książka otrzymała mieszane recenzje, przy czym niektórzy czytelnicy uważają ją za bardzo cenną dla zrozumienia i wdrożenia analizy tekstu w hurtowniach danych, podczas gdy inni krytykują ją za przestarzałość i brak głębi.
Zalety:⬤ Dostarcza jasnych wyjaśnień koncepcji analizy tekstu, ułatwiając komunikację z kierownictwem.
⬤ Oferuje nowe spojrzenie na strategie przechowywania i indeksowania, korzystne dla zespołów hurtowni danych.
⬤ Zawiera cenne pomysły, które mogą poprawić obsługę danych i praktyki zarządzania.
⬤ Niektórzy czytelnicy uznali ją za zbyt drogą i pozbawioną wystarczającej ilości przydatnych informacji.
⬤ Krytyka powtarzających się treści i opieranie się na przestarzałych koncepcjach tradycyjnej hurtowni danych.
⬤ Inni zwrócili uwagę na niezdolność autora do skutecznego odniesienia się do nieustrukturyzowanych danych, określając książkę jako wypełnioną żargonem i paplaniną.
(na podstawie 6 opinii czytelników)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Dowiedz się od legendy hurtowni danych, Billa Inmona, jak zbudować środowisko raportowania, którego potrzebuje Twoja firma.
Odpowiedzi na wiele cennych pytań biznesowych kryją się w tekście. Jak dobrze istniejące środowisko raportowania może wyodrębnić niezbędny tekst z wiadomości e-mail, arkuszy kalkulacyjnych i dokumentów oraz umieścić go w użytecznym formacie do analizy i raportowania? Przekształcenie tradycyjnej hurtowni danych w wydajną hurtownię danych nieustrukturyzowanych wymaga dodatkowych umiejętności od analityka, architekta, projektanta i programisty. Ta książka przygotuje Cię do pomyślnego wdrożenia nieustrukturyzowanej hurtowni danych, a dzięki jasnym wyjaśnieniom, przykładom i studiom przypadków poznasz nowe techniki i wskazówki, jak skutecznie pozyskiwać i analizować tekst.
Opanuj te dziesięć celów:
⬤ Zbuduj nieustrukturyzowaną hurtownię danych przy użyciu 11-etapowego podejścia.
⬤ Zintegrować tekst i opisać go pod względem jednorodności, trafności, nośnika, objętości i struktury.
⬤ Przezwyciężenie wyzwań, takich jak: nijakość, wieża Babel i brak naturalnych relacji.
⬤ Unikaj złomowiska danych i walcz z "pajęczą siecią".
⬤ Ponowne wykorzystanie technik udoskonalonych w tradycyjnej hurtowni danych i hurtowni danych 2. 0, w tym rozwój iteracyjny.
⬤ Stosowanie podstawowych technik wyodrębniania, przekształcania i ładowania tekstu (ETL), takich jak rozpoznawanie fraz, filtrowanie słów stop i zastępowanie synonimów.
⬤ Projektowanie systemu inwentaryzacji dokumentów i łączenie nieustrukturyzowanego tekstu z ustrukturyzowanymi danymi.
⬤ Wykorzystanie indeksów do wydajnej analizy tekstu i taksonomii do użytecznej kategoryzacji zewnętrznej.
⬤ Zarządzanie dużymi ilościami danych przy użyciu zaawansowanych technik, takich jak wskaźniki wsteczne.
⬤ Ocenianie technologii odpowiednich do przetwarzania danych nieustrukturyzowanych, takich jak urządzenia hurtowni danych.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)