Ocena:
Książka na temat skrobania stron internetowych została w dużej mierze dobrze przyjęta, szczególnie wśród osób z podstawową znajomością Pythona. Jest chwalona za łatwość czytania, informacje i dobrą strukturę. Zauważono jednak, że książka zakłada wcześniejszą wiedzę techniczną, co czyni ją wyzwaniem dla zupełnie początkujących. Niektórzy użytkownicy wyrażają również rozczarowanie konkretnymi szczegółami i przykładami zawartymi w tekście.
Zalety:⬤ Łatwa w czytaniu
⬤ pouczająca
⬤ dobrze zorganizowana struktura
⬤ odpowiednia dla osób z podstawową znajomością Pythona
⬤ praktyczne wskazówki dotyczące różnych aplikacji do skrobania stron internetowych
⬤ zawiera przydatne odniesienia i małe przykłady kodu
⬤ wielu czytelników uznało ją za pomocną w ich projektach.
⬤ Nie nadaje się dla zupełnie początkujących ze względu na założenie wcześniejszej wiedzy w Pythonie i technologiach internetowych
⬤ niektóre przykłady kodu mogą być złożone i niewystarczająco wyjaśnione
⬤ niektóre tematy mogą być przestarzałe lub zbędne
⬤ mieszane opinie na temat głębokości pokrycia różnych tematów.
(na podstawie 33 opinii czytelników)
Web Scraping with Python: Collecting More Data from the Modern Web
Jeśli programowanie jest magią, to web scraping jest z pewnością formą czarodziejstwa. Pisząc prosty, zautomatyzowany program, można wysyłać zapytania do serwerów internetowych, żądać danych i analizować je w celu wyodrębnienia potrzebnych informacji. Rozszerzone wydanie tej praktycznej książki nie tylko wprowadza w tematykę web scrapingu, ale także służy jako kompleksowy przewodnik po pozyskiwaniu niemal każdego rodzaju danych z nowoczesnej sieci.
Część I koncentruje się na mechanice web scrapingu: używaniu Pythona do żądania informacji z serwera WWW, wykonywaniu podstawowej obsługi odpowiedzi serwera i zautomatyzowanej interakcji z witrynami. W części II zbadano szereg bardziej specyficznych narzędzi i aplikacji, które pasują do każdego scenariusza skrobania stron internetowych, z którym możesz się spotkać.
⬤ Analizowanie skomplikowanych stron HTML.
⬤ Tworzenie crawlerów za pomocą frameworka Scrapy.
⬤ Poznanie metod przechowywania zeskrobanych danych.
⬤ Odczytywać i wyodrębniać dane z dokumentów.
⬤ Czyścić i normalizować źle sformatowane dane.
⬤ Czytać i pisać w językach naturalnych.
⬤ Przeszukiwanie formularzy i loginów.
⬤ Skrobanie JavaScript i indeksowanie przez API.
⬤ Używać i pisać oprogramowanie zamieniające obraz na tekst.
⬤ Unikaj pułapek scrapingowych i blokad botów.
⬤ Używaj scraperów do testowania swojej strony.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)