1. Fogalom magyarul: RAG (Retrieval-Augmented Generation) 2. Fogalom angolul: Retrieval-Augmented Generation 3. Meghatározás: Hibrid mesterséges intelligencia technika, egy generatív modell (például egy nyelvi modell) képességeit visszakereső rendszerrel kombinálja. Ennek célja az információ pontosságának és relevanciájának növelése. A RAG-ban a rendszer lekédezi a releváns dokumentumokat vagy adatokat egy (vagy több) külső adatforrásból, és felhasználja ezeket a generálási folyamat során, Ezzel kontextuálisan gazdagabb és tényszerűen megalapozottabb kimeneteket állíthat elő. 4. Hivatkozások: 1. Izacard, G., & Grave, E. (2021). *Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering*. arXiv preprint arXiv:2007.01282. (https://arxiv.org/abs/2007.01282) 2. Lewis, P., Perez, E., Piktus, A., et al. (2020). *Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks*. arXiv preprint arXiv:2005.11401. (https://arxiv.org/abs/2005.11401) 5. Megjegyzések: A RAG jelentősége elsősorban abban áll, hogy csökkenti az önálló generatív modellek bizonyos hiányosságainak mértékét. Ezek a következők: Hallucinációcsökkentés. Azzal, hogy a válaszait a RAG lekérdezett adatokkal igyekszik megalapozni, jó eséllyel javítja a felhasznált információ tényszerőségét, pontosságát, ezzel csökkentheti a „hallucináció” esélyét. A fejlődő tudás kezelése. A rendszer újratanítása nélkül ad lehetőséget annak naprakészen tartásához. Hatékony memóriahasználat. Nem szükséges minden információt az alap MI modellen belül tárolni, ha a RAG dinamikusan hozzáfér a külső forrásokhoz. RAG alkalmazási területek: Kérdés megválaszolása: pontosabb válaszok aktuális visszakeresés alapján. Ügyféltámogatás: chatbot vállalatspecifikus dokumentációkra alapozva. Szakterület-specifikus (pl. jogi vagy orvosi) szakirodalomra alapozott tanácsok. Kihívások a RAG alkalmazásában: Mivel a RAG a visszakeresett adatok relevanciájára és pontosságára támaszkodik, a visszakeresés hibái szuboptimális kimeneteket eredményeznek. A visszakeresési lépés időigényes lehet nagy adatkészlet esetén. A visszakereső és a generáló komponensek közötti interakció önmagában is hibaforrás. Külső adatforrások bevonása adatszivárgás kockázatával járhat. 6. Kulcsszavak: mesterséges intelligencia, Retrieval-Augmented Generation, hallucináció