RAG

1. Fogalom magyarul: RAG (Retrieval-Augmented Generation)

2. Fogalom angolul: Retrieval-Augmented Generation

3. Meghatározás:

Hibrid mesterséges intelligencia technika, egy generatív modell (például egy nyelvi modell) képességeit visszakereső rendszerrel kombinálja. Ennek célja az információ pontosságának és relevanciájának növelése. A RAG-ban a rendszer lekédezi a releváns dokumentumokat vagy adatokat egy (vagy több) külső adatforrásból, és felhasználja ezeket a generálási folyamat során, Ezzel kontextuálisan gazdagabb és tényszerűen megalapozottabb kimeneteket állíthat elő.

4. Hivatkozások:

1. Izacard, G., & Grave, E. (2021). *Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering*. arXiv preprint arXiv:2007.01282. (https://arxiv.org/abs/2007.01282)

2. Lewis, P., Perez, E., Piktus, A., et al. (2020). *Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks*. arXiv preprint arXiv:2005.11401. (https://arxiv.org/abs/2005.11401)

5. Megjegyzések:

A RAG jelentősége elsősorban abban áll, hogy csökkenti az önálló generatív modellek bizonyos hiányosságainak mértékét. Ezek a következők:

Hallucinációcsökkentés. Azzal, hogy a válaszait a RAG lekérdezett adatokkal igyekszik megalapozni, jó eséllyel javítja a felhasznált információ tényszerőségét, pontosságát, ezzel csökkentheti a „hallucináció” esélyét.

A fejlődő tudás kezelése. A rendszer újratanítása nélkül ad lehetőséget annak naprakészen tartásához.

Hatékony memóriahasználat. Nem szükséges minden információt az alap MI modellen belül tárolni, ha a RAG dinamikusan hozzáfér a külső forrásokhoz.

RAG alkalmazási területek:

  • Kérdés megválaszolása: pontosabb válaszok aktuális visszakeresés alapján.
  • Ügyféltámogatás: chatbot vállalatspecifikus dokumentációkra alapozva.
  • Szakterület-specifikus (pl. jogi vagy orvosi) szakirodalomra alapozott tanácsok.

Kihívások a RAG alkalmazásában: Mivel a RAG a visszakeresett adatok relevanciájára és pontosságára támaszkodik, a visszakeresés hibái szuboptimális kimeneteket eredményeznek. A visszakeresési lépés időigényes lehet nagy adatkészlet esetén. A visszakereső és a generáló komponensek közötti interakció önmagában is hibaforrás.  Külső adatforrások bevonása adatszivárgás kockázatával járhat.

6. Kulcsszavak:

mesterséges intelligencia, Retrieval-Augmented Generation, hallucináció

188 Megtekintés
Átlagos (0 Szavazatok)

Gyakran ismételt kérdések

Hogyan tudok hozzászólást fűzni a szócikkhez?

Regisztráció után (egy név és egy valós e-mail cím kell hozzá) lehet hozzászólni.

Ki felügyeli a fogalmak helyességét?

A Hírközlési és Informatikai Tudományos Egyesület által létrehozott szerkesztőbizottság hagyja jóvá a fogalmakat.

Lehet bővíteni a fogalomtárat?

A szerkesztőség határozza meg definiálandó fogalmakat. Örömmel vesszük javaslatait a „További fogalmak” oldalon található űrlap kitöltésével.