Książka kucharska Python Web Scraping - Mistrzowska ekstrakcja danych internetowych z ponad 90 przepisami

Książka kucharska Python Web Scraping: Ponad 90 sprawdzonych przepisów na skrobanie w Pythonie, mikrousługi, Docker i AWS (Michael Heydt)

Opinie czytelników

Podsumowanie:

Książka o skrobaniu stron internetowych otrzymała w dużej mierze negatywne recenzje, a użytkownicy wyrażali frustrację z powodu jej braku głębi i praktycznych wskazówek. Niektórzy stwierdzili, że bardziej korzystne jest szukanie pomocy w zasobach internetowych, takich jak YouTube i Stack Overflow.

Zalety:

Niektórzy użytkownicy stwierdzili, że książka może dostarczyć podstawowej wiedzy na temat różnych bibliotek scrapingowych i może być przydatna dla użytkowników zainteresowanych crawlingiem, a nie scrapingiem znanych witryn.

Wady:

Książka nie zapewnia wystarczającej ilości szczegółów do praktycznego zastosowania, szczególnie dla początkujących/pośredników. Brakuje w niej istotnych tematów, takich jak obsługa haseł i JavaScript. Wiele osób uznało ją za nieodpowiednią i zasugerowało, że zasoby online są znacznie bardziej skuteczne.

(na podstawie 3 opinii czytelników)

Oryginalny tytuł:

Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS

Zawartość książki:

Uwolnij się od złożoności skrobania stron internetowych i z łatwością uzyskuj dostęp do danych internetowych za pomocą skryptów Python.

Kluczowe cechy

⬤ Praktyczne przepisy na rozwój umiejętności skrobania stron internetowych do poziomu eksperta.

⬤ Kompleksowy przewodnik po skomplikowanych i wymagających zadaniach web scrapingu przy użyciu Pythona.

⬤ Zrozumienie struktur stron internetowych i łatwe zbieranie danych z witryny.

Opis książki

Python Web Scraping Cookbook to skoncentrowana na rozwiązaniach książka, która nauczy Cię technik tworzenia wysokowydajnych skrobaków i radzenia sobie z crawlerami, mapami witryn, automatyzacją formularzy, witrynami opartymi na Ajaxie, cache'ami i nie tylko.

Poznasz szereg rzeczywistych scenariuszy, w których każda część cyklu rozwoju/produktu zostanie w pełni uwzględniona. Nie tylko rozwiniesz umiejętności potrzebne do projektowania i opracowywania niezawodnych przepływów danych, ale także wdrożysz swoją bazę kodu w AWS. Jeśli jesteś zaangażowany w inżynierię oprogramowania, rozwój produktu lub eksplorację danych (lub jesteś zainteresowany budowaniem produktów opartych na danych), znajdziesz tę książkę przydatną, ponieważ każdy przepis ma jasny cel i cel. Począwszy od wyodrębniania danych ze stron internetowych, a skończywszy na napisaniu zaawansowanego crawlera internetowego, niezależne przepisy zawarte w książce będą darem niebios. Książka ta obejmuje biblioteki Pythona, żądania i BeautifulSoup. Dowiesz się o crawlingu, web spideringu, pracy ze stronami Ajax, paginowanych elementach i nie tylko. Nauczysz się również radzić sobie z problemami takimi jak błędy 403, praca z proxy, skrobanie obrazów i LXML.

Pod koniec tej książki będziesz w stanie skrobać strony internetowe bardziej efektywnie i będziesz w stanie.

Wdrażać i obsługiwać swój scraper w chmurze.

Czego się nauczysz

⬤ Używać różnych narzędzi do skrobania dowolnej strony internetowej i danych, w tym BeautifulSoup, Scrapy, Selenium i wielu innych.

⬤ Opanować języki wyrażeń, takie jak XPath i CSS, oraz wyrażenia regularne w celu wyodrębnienia danych internetowych.

⬤ Radzenie sobie z pułapkami scrapingu, takimi jak ukryte pola formularzy, dławienie, paginacja i różne kody statusu.

⬤ Budowanie solidnych potoków scrapingu za pomocą SQS i RabbitMQ.

⬤ Skrobanie zasobów, takich jak obrazy multimedialne i dowiedz się, co zrobić, gdy Scraper nie działa.

⬤ Poznaj techniki ETL budowania niestandardowego crawlera, parsera i konwertowania ustrukturyzowanych i nieustrukturyzowanych danych ze stron internetowych.

⬤ Wdrożenie i uruchomienie scrapera jako usługi w AWS Elastic Container Service.

Dla kogo jest ta książka

Ta książka jest idealna dla programistów Pythona, administratorów sieci, specjalistów ds. bezpieczeństwa i każdego, kto chce przeprowadzić analitykę internetową. Znajomość języka Python i podstawowa wiedza na temat skrobania stron internetowych będą przydatne, aby jak najlepiej wykorzystać tę książkę.

Dodatkowe informacje o książce:

ISBN:	9781787285217
Autor:	Michael Heydt
Wydawca:	Packt Pub
Język:	angielski
Oprawa:	Miękka oprawa

Zakup:

Obecnie dostępne, na stanie.

Książka kucharska Python Web Scraping: Ponad 90 sprawdzonych przepisów na skrobanie w Pythonie, mikrousługi, Docker i AWS

Opinie czytelników

Oryginalny tytuł:

Zawartość książki:

Dodatkowe informacje o książce:

Zakup:

Inne książki autora:

Prace autora wydały następujące wydawnictwa: