به زبان ساده، تکنیک RAG منابع جدیدی را در اختیار مدل می‌گذارد تا از آن در تولید خروجی استفاده کند. در تکنیک RAG‌، بر خلاف فاین‌تیونینگ پارامتر‌های مدل دست‌نخورده باقی می‌مانند. مثلاً اگر مدلی مثل Llama 3.1 را به اسناد تاریخی متصل باشد، پیش از پاسخگویی آن اسناد را مطالعه می‌کند و پاسخی که می‌دهد دقت بالاتری دارد.

در پشت پردهٔ RAG تبدیل ورودی کاربر و منابع به Embedding Map صورت می‌پذیرد.