Ocena:
Obecnie brak opinii czytelników. Ocena opiera się na 2 głosach.
Learning-Based Control: A Tutorial and Some Recent Results
Niedawny sukces uczenia ze wzmocnieniem i powiązanych metod można przypisać kilku kluczowym czynnikom. Po pierwsze, jest ono napędzane sygnałami nagrody uzyskiwanymi poprzez interakcję ze środowiskiem. Po drugie, jest ściśle związane z ludzkim zachowaniem uczenia się. Po trzecie, ma solidne podstawy matematyczne. Niemniej jednak, konwencjonalna teoria uczenia ze wzmocnieniem wykazuje pewne niedociągnięcia, szczególnie w środowisku ciągłym lub przy rozważaniu stabilności i odporności kontrolowanego procesu.
W niniejszej monografii autorzy opierają się na Reinforcement Learning, aby przedstawić oparte na uczeniu się podejście do kontrolowania systemów dynamicznych z danych w czasie rzeczywistym i dokonać przeglądu niektórych głównych osiągnięć w tej stosunkowo młodej dziedzinie. Czyniąc to, autorzy opracowują ramy dla teorii sterowania opartej na uczeniu się, która pokazuje, jak uczyć się bezpośrednio nieoptymalnych kontrolerów z danych wejściowo-wyjściowych.
Istnieją trzy główne wyzwania związane z rozwojem kontroli opartej na uczeniu się. Po pierwsze, istnieje potrzeba uogólnienia istniejących metod rekurencyjnych. Po drugie, jako podstawowa różnica między sterowaniem opartym na uczeniu się a uczeniem ze wzmocnieniem, stabilność i odporność są ważnymi kwestiami, którymi należy się zająć w przypadku systemów inżynieryjnych o krytycznym znaczeniu dla bezpieczeństwa, takich jak samojezdne samochody. Po trzecie, wydajność danych algorytmów uczenia ze wzmocnieniem musi być uwzględniona w systemach inżynieryjnych o krytycznym znaczeniu dla bezpieczeństwa.
Niniejsza monografia zapewnia czytelnikowi przystępny elementarz na temat nowego kierunku w teorii sterowania, który wciąż jest w powijakach, a mianowicie teorii sterowania opartej na uczeniu się, która jest ściśle związana z literaturą bezpiecznego uczenia się ze wzmocnieniem i adaptacyjnego programowania dynamicznego.
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)