18. diel - Deep Q-learning v Pythone
V minulej lekcii, Q-Learning v Pythone , sme si ukázali Q-Learning v Pythone na príklade MountainCar.
Motivácia
V minulom článku sme vytvorili Q-learning algoritmus, ktorý sa zvládol naučiť MountainCar. Aj keď to tak vyzerať nemusí, v porovnaní s inými hrami išlo o veľmi jednoduché prostredie, v ktorom nám stačilo poznať len dve informácie – rýchlosť a pozícia agenta. V takom jednoduchom prípade nám naozaj stačí jednoduchá tabuľka na udržanie hodnôt kvality jednotlivých a
...koniec náhľadu článku...
Pokračuj ďalej
Vedomosti v hodnote stoviek tisíc získaš za pár korún
Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť tento kurz
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
Čo od nás v ďalších lekciách dostaneš?
- Neobmedzený a trvalý prístup k jednotlivým lekciím.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
Popis a tvorba vlastného DQN (Deep Q-Learning) algoritmu v Pythone a jeho využitie pre Cartpole prostredie v OpenAI Gym.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.