Digital Transformation
Re-Ranking (Pengurutan Ulang Hasil Pencarian)
Re-ranking adalah tahap kedua dalam sistem pencarian RAG yang menyusun ulang kandidat dokumen hasil retrieval awal agar dokumen paling relevan naik ke atas sebelum dikirim ke LLM.
TL;DR: Re-ranking adalah lapisan kedua di pipeline RAG yang menyusun ulang 20 sampai 100 kandidat dari retrieval awal pakai model lebih akurat seperti cross-encoder. Tujuannya satu, memastikan jawaban LLM dibangun dari konteks paling relevan, bukan sekadar paling cepat ditemukan.
Apa itu Re-Ranking?
Re-ranking adalah proses menyusun ulang daftar dokumen hasil retrieval pertama berdasarkan skor relevansi yang lebih akurat. Pada pipeline RAG standar, retrieval pertama menggunakan dense retrieval atau sparse retrieval yang cepat tapi kasar. Re-ranker kemudian menilai ulang kandidat itu satu per satu dengan model yang lebih berat, biasanya cross-encoder, supaya dokumen paling cocok berada di posisi atas.
Analogi sederhana, retrieval awal mirip pustakawan yang ambil 50 buku dari rak berdasarkan judul. Re-ranking mirip editor yang baca daftar isi tiap buku lalu mengurutkan ulang berdasarkan kecocokan dengan pertanyaan pengguna.
Cara Kerja di Pipeline RAG
| Tahap | Fungsi | Latensi tipikal |
|---|---|---|
| 1. Retrieval awal | Ambil 20 sampai 100 kandidat via vector + BM25 | 50 sampai 150 ms |
| 2. Re-ranking | Skor ulang kandidat pakai cross-encoder | 100 sampai 400 ms |
| 3. Top-k final | Kirim 3 sampai 10 dokumen teratas ke LLM | langsung |
Model re-ranker populer mencakup Cohere Rerank, BGE Reranker, dan Jina Reranker. Pilihan tergantung bahasa target, biaya, dan latensi yang bisa diterima.
Kenapa Penting?
Tanpa re-ranking, LLM sering dapat konteks setengah-relevan yang menurunkan retrieval precision dan menaikkan risiko LLM hallucination. Untuk brand Indonesia yang membangun chatbot internal atau search bertenaga AI, re-ranking jadi pembeda antara jawaban yang membantu dan jawaban yang merusak kepercayaan pengguna.
Pertanyaan Umum
Apakah re-ranking selalu wajib di RAG?
Tidak selalu, tapi sangat dianjurkan saat dataset di atas beberapa ribu dokumen atau saat akurasi jawaban penting. Untuk knowledge base kecil di bawah 500 dokumen, retrieval awal yang baik kadang sudah cukup.
Berapa biaya tambahan re-ranking?
Bervariasi. Cohere Rerank dan layanan serupa umumnya menambah 100 sampai 400 ms latensi dan biaya per 1000 query. Kalkulasi biaya tergantung volume dan jumlah kandidat yang dinilai ulang.
Istilah Terkait