به زبان ساده، تکنیک RAG منابع جدیدی را در اختیار مدل میگذارد تا از آن در تولید خروجی استفاده کند. در تکنیک RAG، بر خلاف فاینتیونینگ پارامترهای مدل دستنخورده باقی میمانند. مثلاً اگر مدلی مثل Llama 3.1
را به اسناد تاریخی متصل باشد، پیش از پاسخگویی آن اسناد را مطالعه میکند و پاسخی که میدهد دقت بالاتری دارد.