
Optimal Adaptive Control and Differential Games by Reinforcement Learning Principles
Regulatory adaptacyjne i optymalne to dwie różne metody projektowania automatycznych systemów sterowania.
Regulatory adaptacyjne uczą się online w czasie rzeczywistym, jak kontrolować systemy, ale nie zapewniają optymalnej wydajności, podczas gdy optymalne regulatory muszą być projektowane offline przy użyciu pełnej wiedzy o dynamice systemów. Niniejsza książka pokazuje, w jaki sposób przybliżone programowanie dynamiczne - technika uczenia maszynowego ze wzmocnieniem, która jest motywowana mechanizmami uczenia się w systemach biologicznych i zwierzęcych, może być wykorzystana do zaprojektowania rodziny algorytmów adaptacyjnego sterowania optymalnego, które zbiegają się w czasie rzeczywistym do optymalnych rozwiązań sterowania poprzez pomiar danych wzdłuż trajektorii systemu.
W książce opisano również, jak wykorzystać przybliżone metody programowania dynamicznego do rozwiązywania wieloosobowych gier różniczkowych online. Wykazano, że gry różnicowe są ważne w odpornym sterowaniu Hinfinity w celu odrzucania zakłóceń oraz w koordynowaniu działań wielu agentów w zespołach sieciowych. Niniejsza książka koncentruje się na systemach czasu ciągłego, których modele dynamiczne można wyprowadzić bezpośrednio z zasad fizycznych opartych na dynamice hamiltonowskiej lub lagranżowskiej.
W całej książce podano przykłady symulacji i opisano kilka metod, które nie wymagają pełnej informacji o dynamice stanu. Książka "Optimal Adaptive Control and Differential Games by Reinforcement Learning Principles" jest niezbędnym dodatkiem do półek inżynierów mechaników, elektryków i inżynierów lotnictwa zajmujących się projektowaniem systemów sterowania ze sprzężeniem zwrotnym.