Digital Transformation
Vector Recall (Tingkat Temu Kembali Vektor di Retrieval AI)
Vector Recall adalah persentase dokumen relevan yang berhasil ditemukan oleh sistem pencarian vektor pada saat retrieval, menjadi indikator seberapa lengkap bahan jawaban yang dipakai mesin AI.
TL;DR: Vector Recall adalah persentase dokumen relevan yang berhasil ditemukan oleh sistem retrieval berbasis vektor saat menyusun jawaban AI. Semakin tinggi recall, semakin lengkap bahan jawaban yang dipakai mesin AI. Bagi marketer, recall yang rendah berarti konten brand berisiko terlewat meski sebenarnya relevan dengan pertanyaan pengguna.
Apa itu Vector Recall?
Vector Recall adalah metrik yang mengukur kemampuan sistem retrieval berbasis embedding untuk menemukan semua dokumen yang seharusnya muncul. Cara kerjanya, setiap potongan konten diubah menjadi vektor numerik, lalu sistem mencari vektor yang paling dekat dengan vektor pertanyaan. Recall membandingkan jumlah dokumen relevan yang berhasil ditemukan terhadap total dokumen relevan yang sebenarnya ada di koleksi.
Bedakan dari Retrieval Precision. Precision mengukur seberapa bersih hasil pencarian, sementara recall mengukur seberapa lengkap hasil tersebut. Keduanya saling melengkapi dan biasanya menjadi dua sisi yang harus diseimbangkan.
Cara Kerja Vector Recall
| Tahap | Penjelasan |
|---|---|
| Embedding Konten | Setiap chunk konten diubah jadi vektor numerik |
| Embedding Query | Pertanyaan pengguna diubah jadi vektor dengan model yang sama |
| Similarity Search | Sistem mencari vektor konten yang paling mirip dengan vektor query |
| Threshold | Ambang batas kemiripan menentukan dokumen masuk hasil |
| Evaluasi | Recall dihitung dari rasio dokumen relevan yang berhasil ditemukan |
Praktik standar di industri menyebut recall sehat untuk RAG biasanya di atas 80% pada top-10 dokumen, sebagaimana dipaparkan dalam dokumentasi pgvector.
Kenapa Penting?
Bagi website bisnis Indonesia, Vector Recall menentukan apakah konten brand muncul sebagai bahan jawaban di AI Search. Konten yang ditulis tidak terstruktur, dengan chunk yang acak dan kalimat ambigu, cenderung punya recall rendah. Cara meningkatkannya antara lain memastikan Chunk Cohesion yang baik, menulis dalam LLM-Friendly Markdown, dan menjaga relevansi semantik antar paragraf.
Pertanyaan Umum
Apakah Vector Recall sama dengan ranking di Google?
Tidak sama. Ranking Google adalah urutan tampil di hasil pencarian tradisional, sedangkan Vector Recall adalah cakupan dokumen yang ditemukan sistem retrieval berbasis vektor untuk dijadikan bahan jawaban AI.
Bagaimana cara meningkatkan recall konten saya?
Strukturkan konten dalam paragraf self-contained, gunakan heading deskriptif, sebut entitas utama secara konsisten, dan pastikan setiap chunk membawa konteks lengkap agar embedding menangkap maknanya dengan benar.
Istilah Terkait