IT rekvalifikácia. Seniorní programátori zarábajú až 6 000 €/mesiac a rekvalifikácia je prvým krokom. Zisti, ako na to!

18. diel - Deep Q-learning v Pythone

V minulej lekcii, Q-Learning v Pythone , sme si ukázali Q-Learning v Pythone na príklade MountainCar.

Motivácia

V minulom článku sme vytvorili Q-learning algoritmus, ktorý sa zvládol naučiť MountainCar. Aj keď to tak vyzerať nemusí, v porovnaní s inými hrami išlo o veľmi jednoduché prostredie, v ktorom nám stačilo poznať len dve informácie – rýchlosť a pozícia agenta. V takom jednoduchom prípade nám naozaj stačí jednoduchá tabuľka na udržanie hodnôt kvality jednotlivých a

 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 675 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 22 článkom (18 lekcií, 4 testy) tohoto kurzu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

Popis a tvorba vlastného DQN (Deep Q-Learning) algoritmu v Pythone a jeho využitie pre Cartpole prostredie v OpenAI Gym.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Marek Bečvář
Avatar
Marek Bečvář
Aktivity