Digital Transformation
Reranking
Reranking adalah tahap kedua di sistem retrieval yang menyusun ulang hasil pencarian awal pakai model lebih akurat agar dokumen paling relevan naik ke atas sebelum dikirim ke LLM.
TL;DR: Reranking adalah tahap pasca-retrieval yang menyusun ulang kandidat dokumen pakai model lebih cermat (cross-encoder) supaya dokumen paling relevan ada di posisi teratas. Dipakai di sistem RAG untuk meningkatkan akurasi jawaban tanpa harus memperbesar context window.
Apa itu Reranking?
Reranking adalah proses dua tahap dalam pipeline pencarian. Tahap pertama (retrieval) menarik puluhan kandidat secara cepat lewat vector database atau hybrid search. Tahap kedua, reranker membaca pasangan query dan dokumen secara berdampingan, lalu memberi skor relevansi yang lebih akurat.
Analogi sederhananya seperti screening CV. Tahap pertama menyaring 100 lamaran yang lolos kata kunci. Tahap reranking adalah membaca isi 100 CV itu satu per satu untuk menentukan 5 kandidat terbaik yang dipanggil interview.
Cara Kerja
| Tahap | Tujuan | Latensi |
|---|---|---|
| Retrieval (top-k) | Tarik 20-100 kandidat cepat | Puluhan ms |
| Reranker (cross-encoder) | Skor ulang kandidat | 100-500 ms |
| Top-N akhir | Kirim 3-5 dokumen ke LLM | Nol (sudah selesai) |
Model reranker populer: Cohere Rerank, BGE Reranker, Voyage Rerank.
Kenapa Penting?
Tanpa reranking, sistem RAG sering memberi LLM dokumen yang mirip secara semantik tapi tidak menjawab pertanyaan. Praktik standar di industri menunjukkan reranking dapat menaikkan presisi top-3 sebesar 10-30% pada dokumen panjang. Untuk produk Indonesia yang melayani query bahasa campuran (ID dan EN), reranker bilingual memberi hasil lebih konsisten dibanding hanya mengandalkan embedding similarity.
Pertanyaan Umum
Apakah reranking selalu diperlukan?
Tidak selalu. Untuk korpus kecil di bawah 1.000 dokumen dengan query sederhana, retrieval saja sering cukup. Reranking memberi dampak besar saat top-k membawa banyak kandidat mirip.
Apakah reranking memperlambat sistem secara signifikan?
Reranker menambah 100-500 ms tergantung jumlah kandidat dan model. Untuk aplikasi yang butuh sub-detik, batasi top-k yang masuk ke reranker maksimal 20-30 dokumen.
Istilah Terkait