Digital Transformation
Prompt Grounding Rate
Prompt Grounding Rate adalah persentase respons LLM yang sukses ditopang oleh sumber data resmi yang disuntikkan ke konteks, dipakai tim produk untuk mengukur kualitas fitur AI berbasis dokumen.
TL;DR: Prompt Grounding Rate adalah persentase respons model bahasa yang dapat dirujuk balik ke sumber data yang disuntikkan ke prompt, biasanya lewat konteks RAG atau dokumen yang dilampirkan. Metrik ini menjadi alat ukur penting di tim produk yang membangun fitur AI berbasis dokumen perusahaan, karena memisahkan jawaban yang grounded dari halusinasi. Tolok ukur sehat untuk asisten dokumen internal berada di kisaran 85-95%.
Apa itu Prompt Grounding Rate?
Prompt Grounding Rate menghitung berapa persen respons LLM yang setiap klaimnya dapat ditelusuri kembali ke chunk sumber yang masuk konteks pada saat generation. Konsepnya mirip LLM Faithfulness, tetapi fokus pada lapis input prompt, bukan model behavior secara umum. Rumus: Grounding Rate = (jawaban dengan klaim ter-trace ke sumber / total jawaban dievaluasi) × 100%.
Untuk fitur produk seperti chatbot dokumentasi atau asisten internal, metrik ini memberi sinyal apakah pipeline RAG berhasil menyuplai informasi yang relevan ke model atau model harus menebak.
Cara Mengukur
| Metode | Yang Diperiksa | Cocok Untuk |
|---|---|---|
| LLM-as-judge | Setiap klaim divalidasi model evaluator | Skala besar, otomatisasi |
| Manual review | Analis baca jawaban dan trace ke sumber | Sample audit kualitas |
| Citation overlap | Ratio kalimat yang punya citation valid | Cepat, kuantitatif |
Praktik tim produk modern menggabungkan ketiganya: LLM-as-judge untuk monitoring harian, manual sample mingguan untuk ground truth, dan citation overlap sebagai gerbang kualitas sebelum deploy. Lihat RAG Evaluation untuk detail metode.
Kenapa Penting?
Tim Indonesia yang membangun fitur AI di produk SaaS sering menghadapi tradeoff: model yang lebih kreatif terkadang berhalusinasi, sementara model yang ketat kadang menolak menjawab. Prompt Grounding Rate memberi indikator objektif untuk balancing tersebut. Studi dari riset RAG industri 2025 menunjukkan grounding rate di bawah 70% sering berkorelasi dengan keluhan pengguna soal jawaban tidak akurat. Naikkan rate ini dengan memperbaiki retrieval (chunking, [reranking](/glosarium/reranker)), bukan hanya prompt model.
Pertanyaan Umum
Apakah Grounding Rate sama dengan akurasi?
Tidak. Grounding Rate hanya mengukur apakah klaim ter-trace ke sumber, bukan apakah sumbernya benar. Akurasi butuh evaluasi tambahan terhadap kebenaran konten sumber.
Bagaimana cara cepat menaikkannya?
Periksa retrieval terlebih dulu. Jika chunk yang relevan tidak masuk top-K, tidak ada prompt engineering yang bisa membantu. Pastikan reranker dan strategi chunking sesuai domain dokumen.
Istilah Terkait