Digital Transformation

RAG (Retrieval Augmented Generation)

RAG adalah arsitektur AI yang menggabungkan pencarian dokumen relevan dengan model bahasa, sehingga jawaban AI lebih akurat dan terkini.

Vito Atmo
Vito Atmo·22 April 2026·0 kali dibaca·2 min baca

TL;DR: RAG (Retrieval Augmented Generation) adalah arsitektur AI yang menambahkan langkah pencarian dokumen relevan sebelum model bahasa menjawab pertanyaan. Hasilnya, AI bisa memakai data spesifik (dokumen internal, basis pengetahuan) dan mengurangi halusinasi.

Apa itu RAG?

RAG atau Retrieval Augmented Generation adalah pola arsitektur yang memisahkan pengetahuan dari model. Alih-alih melatih ulang model besar dengan data milik perusahaan, RAG mengambil dokumen paling relevan dari database, lalu menempelkannya ke prompt yang dikirim ke Large Language Model (LLM). Model menjawab berdasarkan konteks yang diberikan, bukan hanya memori pelatihan.

Komponen inti RAG, indeks vektor dari dokumen (lihat Vector Search), retriever yang mencari dokumen terdekat, dan generator (LLM) yang merangkai jawaban.

Cara Kerja RAG

TahapAktivitas
IngestionDokumen di-chunk, dikonversi ke embedding, disimpan di vector DB
RetrievalQuery user diubah ke embedding, dicocokkan ke dokumen terdekat
AugmentationDokumen terpilih dimasukkan ke context window prompt
GenerationLLM menjawab berdasarkan konteks plus pengetahuan umum

Metrik relevansi umum memakai cosine similarity, $\cos(\theta) = \dfrac{\vec{q} \cdot \vec{d}}{|\vec{q}| |\vec{d}|}$, dengan $\vec{q}$ vektor query dan $\vec{d}$ vektor dokumen. Nilai mendekati 1 berarti sangat relevan.

Kenapa Penting?

RAG menjadi fondasi banyak chatbot enterprise, sistem customer support, dan AEO (Answer Engine Optimization). Untuk marketer, memahami RAG membantu menyusun konten yang "AI-retrievable", paragraf self-contained, Structured Data, dan heading tanya-jawab yang jelas meningkatkan peluang dokumen dipilih retriever.

Pertanyaan Umum

Apakah RAG sama dengan fine-tuning?

Tidak. Fine-tuning mengubah bobot model, RAG hanya menambah konteks di prompt. RAG lebih murah, lebih cepat update, dan lebih aman untuk data yang sering berubah.

Apakah RAG mengurangi halusinasi sepenuhnya?

Mengurangi, tidak menghilangkan. Kualitas jawaban tetap bergantung pada kualitas dokumen yang diindeks dan pada instruksi prompt ke model.