Ocena:

Książka jest wysoko ceniona za kompleksowe omówienie zastosowań głębokiego uczenia w wizji komputerowej, z silnym naciskiem na praktyczne przykłady i praktyczne kodowanie. Wymaga jednak wcześniejszej znajomości teorii sieci neuronowych, aby w pełni zrozumieć jej wyjaśnienia, a niektórzy użytkownicy zauważyli brak kolorów w druku, co utrudnia czytanie i jest mniej pouczające wizualnie.
Zalety:Kompleksowe uczenie głębokie w wizji komputerowej, jasne wyjaśnienia pojęć, praktyczne przykłady i praktyczne doświadczenia z kodowaniem, włączenie różnych tematów od poziomów podstawowych do zaawansowanych, odniesienia do odpowiednich materiałów, odpowiednie zarówno dla początkujących, jak i doświadczonych profesjonalistów w dziedzinie wizji komputerowej.
Wady:Wymaga wcześniejszej wiedzy na temat sieci neuronowych, aby zrozumieć niektóre wyjaśnienia, brak kolorów w druku może utrudniać czytelność i przejrzystość obrazu.
(na podstawie 5 opinii czytelników)
TensorFlow 2.0 Computer Vision Cookbook: Implement machine learning solutions to overcome various computer vision challenges
Zapoznaj się z najnowocześniejszymi technikami dostosowywania procesów szkoleniowych i zwiększania wydajności komputerowych modeli wizyjnych przy użyciu technik uczenia maszynowego i głębokiego uczenia.
Kluczowe cechy:
⬤ Rozwijaj, trenuj i używaj algorytmów głębokiego uczenia do zadań wizji komputerowej przy użyciu TensorFlow 2.x.
⬤ Odkryj praktyczne przepisy na pokonanie różnych wyzwań napotykanych podczas tworzenia modeli widzenia komputerowego.
⬤ Umożliwienie maszynom uzyskania zrozumienia na poziomie ludzkim w celu rozpoznawania i analizowania cyfrowych obrazów i filmów.
Opis książki:
Wizja komputerowa to dziedzina nauki, która umożliwia maszynom identyfikację i przetwarzanie cyfrowych obrazów i filmów. Niniejsza książka koncentruje się na niezależnych przepisach, które pomogą ci wykonywać różne zadania związane z wizją komputerową przy użyciu TensorFlow.
Książka rozpoczyna się od omówienia podstaw głębokiego uczenia dla wizji komputerowej, wraz z omówieniem kluczowych funkcji TensorFlow 2.x, takich jak interfejsy API Keras i tf. data. Dataset API. Następnie poznasz tajniki typowych zadań związanych z wizją komputerową, takich jak klasyfikacja obrazów, uczenie transferowe, ulepszanie i stylizacja obrazów oraz wykrywanie obiektów. Książka obejmuje również autoenkodery w domenach takich jak odwrotne indeksy wyszukiwania obrazów i odszumianie obrazów, oferując jednocześnie wgląd w różne architektury stosowane w przepisach, takie jak konwolucyjne sieci neuronowe (CNN), CNN oparte na regionach (R-CNN), VGGNet i You Only Look Once (YOLO).
Idąc dalej, odkryjesz wskazówki i triki pozwalające rozwiązać wszelkie problemy napotkane podczas tworzenia różnych aplikacji widzenia komputerowego. Wreszcie, zagłębisz się w bardziej zaawansowane tematy, takie jak Generative Adversarial Networks (GAN), przetwarzanie wideo i AutoML, kończąc na sekcji poświęconej technikom pomagającym zwiększyć wydajność sieci.
Pod koniec tej książki o TensorFlow, będziesz w stanie pewnie poradzić sobie z szerokim zakresem problemów związanych z wizją komputerową przy użyciu TensorFlow 2.x.
Czego się nauczysz:
⬤ Zrozumieć, jak wykrywać obiekty przy użyciu najnowocześniejszych modeli, takich jak YOLOv3.
⬤ Wykorzystanie AutoML do przewidywania płci i wieku na podstawie obrazów.
⬤ Segmentacja obrazów przy użyciu różnych podejść, takich jak FCN i modele generatywne.
⬤ Dowiedz się, jak poprawić wydajność swojej sieci przy użyciu dokładności rank-N, wygładzania etykiet i wydłużania czasu testu.
⬤ Umożliwienie maszynom rozpoznawania emocji ludzi w filmach i strumieniach w czasie rzeczywistym.
⬤ Dostęp i ponowne wykorzystanie zaawansowanych modeli TensorFlow Hub do klasyfikacji obrazów i wykrywania obiektów.
⬤ Generowanie podpisów do obrazów przy użyciu CNN i RNN.
Dla kogo jest ta książka:
Ta książka jest przeznaczona dla programistów i inżynierów zajmujących się wizją komputerową, a także praktyków głębokiego uczenia się, którzy szukają rozwiązań różnych problemów, które często pojawiają się w wizji komputerowej. Dowiesz się z niej, jak wykorzystać nowoczesne techniki uczenia maszynowego (ML) i architektury głębokiego uczenia do wykonywania wielu zadań związanych z wizją komputerową. Wymagana jest podstawowa znajomość programowania w języku Python i wizji komputerowej.