IT rekvalifikácia. Seniorní programátori zarábajú až 6 000 €/mesiac a rekvalifikácia je prvým krokom. Zisti, ako na to!

16. diel - Reinforcement learning v Pythone a OpenAI

V minulej lekcii, Vlastné Multilayer Perceptron v Pythone , sme sa pozreli na vlastný model umelej inteligencie, viacvrstvový perceptron v Pythone.

Reinforcement learning je veľmi zaujímavá metóda strojového učenia vedľa metód pod dozorom a bez dozoru (supervised / unsupervised learning) a môže byť povedané, že je niekde napoly cesty medzi týmito dvoma.

Reinforcement learning

Pri tejto metóde je agent odmeňovaný za chcené a trestaný za nechcené správanie (snažíme sa reinforcenout to, čo od neho chceme). Takt


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 675 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 22 článkom (18 lekcií, 4 testy) tohoto kurzu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

Lekcia zaoberajúce sa metódou strojového učenia reinforcement learning. Zároveň stručná ukážka práce s OpenAI a príprava na riešenie úloh v prostredí Gym.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Marek Bečvář
Avatar
Marek Bečvář
Aktivity