Digital Transformation
RAG (Retrieval Augmented Generation)
RAG adalah arsitektur AI yang menggabungkan pencarian dokumen relevan dengan model bahasa, sehingga jawaban AI lebih akurat dan terkini.
TL;DR: RAG (Retrieval Augmented Generation) adalah arsitektur AI yang menambahkan langkah pencarian dokumen relevan sebelum model bahasa menjawab pertanyaan. Hasilnya, AI bisa memakai data spesifik (dokumen internal, basis pengetahuan) dan mengurangi halusinasi.
Apa itu RAG?
RAG atau Retrieval Augmented Generation adalah pola arsitektur yang memisahkan pengetahuan dari model. Alih-alih melatih ulang model besar dengan data milik perusahaan, RAG mengambil dokumen paling relevan dari database, lalu menempelkannya ke prompt yang dikirim ke Large Language Model (LLM). Model menjawab berdasarkan konteks yang diberikan, bukan hanya memori pelatihan.
Komponen inti RAG, indeks vektor dari dokumen (lihat Vector Search), retriever yang mencari dokumen terdekat, dan generator (LLM) yang merangkai jawaban.
Cara Kerja RAG
| Tahap | Aktivitas |
|---|---|
| Ingestion | Dokumen di-chunk, dikonversi ke embedding, disimpan di vector DB |
| Retrieval | Query user diubah ke embedding, dicocokkan ke dokumen terdekat |
| Augmentation | Dokumen terpilih dimasukkan ke context window prompt |
| Generation | LLM menjawab berdasarkan konteks plus pengetahuan umum |
Metrik relevansi umum memakai cosine similarity, $\cos(\theta) = \dfrac{\vec{q} \cdot \vec{d}}{|\vec{q}| |\vec{d}|}$, dengan $\vec{q}$ vektor query dan $\vec{d}$ vektor dokumen. Nilai mendekati 1 berarti sangat relevan.
Kenapa Penting?
RAG menjadi fondasi banyak chatbot enterprise, sistem customer support, dan AEO (Answer Engine Optimization). Untuk marketer, memahami RAG membantu menyusun konten yang "AI-retrievable", paragraf self-contained, Structured Data, dan heading tanya-jawab yang jelas meningkatkan peluang dokumen dipilih retriever.
Pertanyaan Umum
Apakah RAG sama dengan fine-tuning?
Tidak. Fine-tuning mengubah bobot model, RAG hanya menambah konteks di prompt. RAG lebih murah, lebih cepat update, dan lebih aman untuk data yang sering berubah.
Apakah RAG mengurangi halusinasi sepenuhnya?
Mengurangi, tidak menghilangkan. Kualitas jawaban tetap bergantung pada kualitas dokumen yang diindeks dan pada instruksi prompt ke model.
Istilah Terkait