Digital Transformation

Reranking

Reranking adalah tahap kedua di sistem retrieval yang menyusun ulang hasil pencarian awal pakai model lebih akurat agar dokumen paling relevan naik ke atas sebelum dikirim ke LLM.

Vito Atmo
Vito Atmo·29 April 2026·0 kali dibaca·2 min baca

TL;DR: Reranking adalah tahap pasca-retrieval yang menyusun ulang kandidat dokumen pakai model lebih cermat (cross-encoder) supaya dokumen paling relevan ada di posisi teratas. Dipakai di sistem RAG untuk meningkatkan akurasi jawaban tanpa harus memperbesar context window.

Apa itu Reranking?

Reranking adalah proses dua tahap dalam pipeline pencarian. Tahap pertama (retrieval) menarik puluhan kandidat secara cepat lewat vector database atau hybrid search. Tahap kedua, reranker membaca pasangan query dan dokumen secara berdampingan, lalu memberi skor relevansi yang lebih akurat.

Analogi sederhananya seperti screening CV. Tahap pertama menyaring 100 lamaran yang lolos kata kunci. Tahap reranking adalah membaca isi 100 CV itu satu per satu untuk menentukan 5 kandidat terbaik yang dipanggil interview.

Cara Kerja

TahapTujuanLatensi
Retrieval (top-k)Tarik 20-100 kandidat cepatPuluhan ms
Reranker (cross-encoder)Skor ulang kandidat100-500 ms
Top-N akhirKirim 3-5 dokumen ke LLMNol (sudah selesai)

Model reranker populer: Cohere Rerank, BGE Reranker, Voyage Rerank.

Kenapa Penting?

Tanpa reranking, sistem RAG sering memberi LLM dokumen yang mirip secara semantik tapi tidak menjawab pertanyaan. Praktik standar di industri menunjukkan reranking dapat menaikkan presisi top-3 sebesar 10-30% pada dokumen panjang. Untuk produk Indonesia yang melayani query bahasa campuran (ID dan EN), reranker bilingual memberi hasil lebih konsisten dibanding hanya mengandalkan embedding similarity.

Pertanyaan Umum

Apakah reranking selalu diperlukan?

Tidak selalu. Untuk korpus kecil di bawah 1.000 dokumen dengan query sederhana, retrieval saja sering cukup. Reranking memberi dampak besar saat top-k membawa banyak kandidat mirip.

Apakah reranking memperlambat sistem secara signifikan?

Reranker menambah 100-500 ms tergantung jumlah kandidat dan model. Untuk aplikasi yang butuh sub-detik, batasi top-k yang masuk ke reranker maksimal 20-30 dokumen.

Bagikan