Ocena:

Książka o skrobaniu stron internetowych otrzymała w dużej mierze negatywne recenzje, a użytkownicy wyrażali frustrację z powodu jej braku głębi i praktycznych wskazówek. Niektórzy stwierdzili, że bardziej korzystne jest szukanie pomocy w zasobach internetowych, takich jak YouTube i Stack Overflow.
Zalety:Niektórzy użytkownicy stwierdzili, że książka może dostarczyć podstawowej wiedzy na temat różnych bibliotek scrapingowych i może być przydatna dla użytkowników zainteresowanych crawlingiem, a nie scrapingiem znanych witryn.
Wady:Książka nie zapewnia wystarczającej ilości szczegółów do praktycznego zastosowania, szczególnie dla początkujących/pośredników. Brakuje w niej istotnych tematów, takich jak obsługa haseł i JavaScript. Wiele osób uznało ją za nieodpowiednią i zasugerowało, że zasoby online są znacznie bardziej skuteczne.
(na podstawie 3 opinii czytelników)
Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS
Uwolnij się od złożoności skrobania stron internetowych i z łatwością uzyskuj dostęp do danych internetowych za pomocą skryptów Python.
Kluczowe cechy
⬤ Praktyczne przepisy na rozwój umiejętności skrobania stron internetowych do poziomu eksperta.
⬤ Kompleksowy przewodnik po skomplikowanych i wymagających zadaniach web scrapingu przy użyciu Pythona.
⬤ Zrozumienie struktur stron internetowych i łatwe zbieranie danych z witryny.
Opis książki
Python Web Scraping Cookbook to skoncentrowana na rozwiązaniach książka, która nauczy Cię technik tworzenia wysokowydajnych skrobaków i radzenia sobie z crawlerami, mapami witryn, automatyzacją formularzy, witrynami opartymi na Ajaxie, cache'ami i nie tylko.
Poznasz szereg rzeczywistych scenariuszy, w których każda część cyklu rozwoju/produktu zostanie w pełni uwzględniona. Nie tylko rozwiniesz umiejętności potrzebne do projektowania i opracowywania niezawodnych przepływów danych, ale także wdrożysz swoją bazę kodu w AWS. Jeśli jesteś zaangażowany w inżynierię oprogramowania, rozwój produktu lub eksplorację danych (lub jesteś zainteresowany budowaniem produktów opartych na danych), znajdziesz tę książkę przydatną, ponieważ każdy przepis ma jasny cel i cel. Począwszy od wyodrębniania danych ze stron internetowych, a skończywszy na napisaniu zaawansowanego crawlera internetowego, niezależne przepisy zawarte w książce będą darem niebios. Książka ta obejmuje biblioteki Pythona, żądania i BeautifulSoup. Dowiesz się o crawlingu, web spideringu, pracy ze stronami Ajax, paginowanych elementach i nie tylko. Nauczysz się również radzić sobie z problemami takimi jak błędy 403, praca z proxy, skrobanie obrazów i LXML.
Pod koniec tej książki będziesz w stanie skrobać strony internetowe bardziej efektywnie i będziesz w stanie.
Wdrażać i obsługiwać swój scraper w chmurze.
Czego się nauczysz
⬤ Używać różnych narzędzi do skrobania dowolnej strony internetowej i danych, w tym BeautifulSoup, Scrapy, Selenium i wielu innych.
⬤ Opanować języki wyrażeń, takie jak XPath i CSS, oraz wyrażenia regularne w celu wyodrębnienia danych internetowych.
⬤ Radzenie sobie z pułapkami scrapingu, takimi jak ukryte pola formularzy, dławienie, paginacja i różne kody statusu.
⬤ Budowanie solidnych potoków scrapingu za pomocą SQS i RabbitMQ.
⬤ Skrobanie zasobów, takich jak obrazy multimedialne i dowiedz się, co zrobić, gdy Scraper nie działa.
⬤ Poznaj techniki ETL budowania niestandardowego crawlera, parsera i konwertowania ustrukturyzowanych i nieustrukturyzowanych danych ze stron internetowych.
⬤ Wdrożenie i uruchomienie scrapera jako usługi w AWS Elastic Container Service.
Dla kogo jest ta książka
Ta książka jest idealna dla programistów Pythona, administratorów sieci, specjalistów ds. bezpieczeństwa i każdego, kto chce przeprowadzić analitykę internetową. Znajomość języka Python i podstawowa wiedza na temat skrobania stron internetowych będą przydatne, aby jak najlepiej wykorzystać tę książkę.