Megerősítéses tanulás

1. Fogalom magyarul: megerősítéses tanulás

2. Fogalom angolul: reinforcement learning

3. Meghatározás:

A megerősítéses gépi tanulás egy olyan gépi tanulási megközelítés, amelyben az algoritmus egy környezettel interakcióba lépve tanul, tapasztalatai alapján jutalmak és büntetések rendszerén keresztül. Ezzel a módszerrel az algoritmus a cselekvéseinek következményeit kiértékelve folyamatosan optimalizálja a döntéseit, célja pedig a hosszú távú jutalom maximalizálása. Ez a megközelítés hasonló ahhoz, ahogyan az emberek és az állatok tanulnak a saját tapasztalataik és a környezeti visszajelzések alapján. A megerősítéses tanulásban a fő komponensek közé tartozik az ágens (ügynök), a környezet, a cselekvések, a jutalmak és a büntetések, valamint a szabályok halmaza, amely meghatározza az ügynök cselekvéseit. Az algoritmus célja, hogy egy optimális szabályrendszert és tervet találjon, amely a leghatékonyabb cselekvési sorozatot eredményezi a környezet adott állapotában. A megerősítéses tanulás alkalmazási területei közé tartozik a robotika, ahol az algoritmusok segítik a robotokat abban, hogy összetett feladatokat hajtsanak végre autonóm módon. További alkalmazások közé tartozik a videojátékok irányítása, az automatikus kereskedési rendszerek és az önvezető autók navigációja.

4. Hivatkozások:

  • S. Russell, P. Norvig: Mesterséges intelligencia - modern megközelítésben, Panem, 2005

5. Megjegyzések:

6. Kulcsszavak:

mesterséges intelligencia, gépi tanulás

206 Megtekintés
Átlagos (0 Szavazatok)

Gyakran ismételt kérdések

Hogyan tudok hozzászólást fűzni a szócikkhez?

Regisztráció után (egy név és egy valós e-mail cím kell hozzá) lehet hozzászólni.

Ki felügyeli a fogalmak helyességét?

A Hírközlési és Informatikai Tudományos Egyesület által létrehozott szerkesztőbizottság hagyja jóvá a fogalmakat.

Lehet bővíteni a fogalomtárat?

A szerkesztőség határozza meg definiálandó fogalmakat. Örömmel vesszük javaslatait a „További fogalmak” oldalon található űrlap kitöltésével.