Ocena:
Obecnie brak opinii czytelników. Ocena opiera się na 12 głosach.
Deep Reinforcement Learning with Python: With Pytorch, Tensorflow and Openai Gym
Głębokie uczenie ze wzmocnieniem to szybko rozwijająca się dyscyplina, która ma znaczący wpływ na dziedziny pojazdów autonomicznych, robotyki, opieki zdrowotnej, finansów i wielu innych. Ta książka obejmuje głębokie uczenie ze wzmocnieniem przy użyciu głębokiego uczenia q i modeli gradientu polityki z ćwiczeniami kodowania.
Zaczniesz od przeglądu procesów decyzyjnych Markowa, równań Bellmana i programowania dynamicznego, które stanowią podstawowe koncepcje i fundament głębokiego uczenia się ze wzmocnieniem. Następnie przeanalizujemy uczenie się bez modeli, a następnie aproksymację funkcji przy użyciu sieci neuronowych i głębokiego uczenia się. Następnie omówione zostaną różne algorytmy głębokiego uczenia ze wzmocnieniem, takie jak głębokie q-sieci, różne odmiany metod krytyki aktorów i inne metody oparte na polityce.
Przyjrzymy się również dylematowi eksploracji i eksploatacji, kluczowemu zagadnieniu w algorytmach uczenia ze wzmocnieniem, wraz z wyszukiwaniem drzew Monte Carlo (MCTS), które odegrało kluczową rolę w sukcesie AlphaGo. Ostatnie rozdziały kończą się implementacją głębokiego uczenia ze wzmocnieniem przy użyciu popularnych frameworków głębokiego uczenia, takich jak TensorFlow i PyTorch. W końcu zrozumiesz głębokie uczenie się ze wzmocnieniem wraz z głębokimi sieciami q i implementacją modeli gradientu polityki za pomocą TensorFlow, PyTorch i Open AI Gym.
Czego się nauczysz
⬤ Zbadać głębokie uczenie ze wzmocnieniem.
⬤ Zaimplementować algorytmy głębokiego uczenia się przy użyciu środowiska OpenAI Gym.
⬤ Kodować własnych agentów do gier dla Atari przy użyciu algorytmów krytyki aktorów.
⬤ Zastosuj najlepsze praktyki budowania modeli i szkolenia algorytmów.
Dla kogo jest ta książka
Deweloperzy i architekci uczenia maszynowego, którzy chcą wyprzedzić konkurencję w dziedzinie sztucznej inteligencji i głębokiego uczenia.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)