Web Scraping z Pythonem: Zbieranie większej ilości danych z nowoczesnej sieci

Opinie czytelników

Podsumowanie:

Książka na temat skrobania stron internetowych została w dużej mierze dobrze przyjęta, szczególnie wśród osób z podstawową znajomością Pythona. Jest chwalona za łatwość czytania, informacje i dobrą strukturę. Zauważono jednak, że książka zakłada wcześniejszą wiedzę techniczną, co czyni ją wyzwaniem dla zupełnie początkujących. Niektórzy użytkownicy wyrażają również rozczarowanie konkretnymi szczegółami i przykładami zawartymi w tekście.

Zalety:

⬤ Łatwa w czytaniu
⬤ pouczająca
⬤ dobrze zorganizowana struktura
⬤ odpowiednia dla osób z podstawową znajomością Pythona
⬤ praktyczne wskazówki dotyczące różnych aplikacji do skrobania stron internetowych
⬤ zawiera przydatne odniesienia i małe przykłady kodu
⬤ wielu czytelników uznało ją za pomocną w ich projektach.

Wady:

⬤ Nie nadaje się dla zupełnie początkujących ze względu na założenie wcześniejszej wiedzy w Pythonie i technologiach internetowych
⬤ niektóre przykłady kodu mogą być złożone i niewystarczająco wyjaśnione
⬤ niektóre tematy mogą być przestarzałe lub zbędne
⬤ mieszane opinie na temat głębokości pokrycia różnych tematów.

(na podstawie 33 opinii czytelników)

Oryginalny tytuł:

Web Scraping with Python: Collecting More Data from the Modern Web

Zawartość książki:

Jeśli programowanie jest magią, to web scraping jest z pewnością formą czarodziejstwa. Pisząc prosty, zautomatyzowany program, można wysyłać zapytania do serwerów internetowych, żądać danych i analizować je w celu wyodrębnienia potrzebnych informacji. Rozszerzone wydanie tej praktycznej książki nie tylko wprowadza w tematykę web scrapingu, ale także służy jako kompleksowy przewodnik po pozyskiwaniu niemal każdego rodzaju danych z nowoczesnej sieci.

Część I koncentruje się na mechanice web scrapingu: używaniu Pythona do żądania informacji z serwera WWW, wykonywaniu podstawowej obsługi odpowiedzi serwera i zautomatyzowanej interakcji z witrynami. W części II zbadano szereg bardziej specyficznych narzędzi i aplikacji, które pasują do każdego scenariusza skrobania stron internetowych, z którym możesz się spotkać.

⬤ Analizowanie skomplikowanych stron HTML.

⬤ Tworzenie crawlerów za pomocą frameworka Scrapy.

⬤ Poznanie metod przechowywania zeskrobanych danych.

⬤ Odczytywać i wyodrębniać dane z dokumentów.

⬤ Czyścić i normalizować źle sformatowane dane.

⬤ Czytać i pisać w językach naturalnych.

⬤ Przeszukiwanie formularzy i loginów.

⬤ Skrobanie JavaScript i indeksowanie przez API.

⬤ Używać i pisać oprogramowanie zamieniające obraz na tekst.

⬤ Unikaj pułapek scrapingowych i blokad botów.

⬤ Używaj scraperów do testowania swojej strony.

Dodatkowe informacje o książce:

ISBN:	9781491985571
Autor:	Ryan Mitchell
Wydawca:	Oreilly Media
Oprawa:	Miękka oprawa
Rok wydania:	2018
Liczba stron:	300

Zakup:

Obecnie dostępne, na stanie.