Digital Marketing
AEO Snippet Rerank Latency
TL;DR: AEO Snippet Rerank Latency adalah waktu yang dibutuhkan rerank model untuk mengurutkan ulang snippet kandidat sebelum AI Search menyajikan jawaban akhir. Sweet spot praktis di bawah 180 milidetik. Latency yang lebih tinggi memperkecil peluang konten dipilih untuk dikutip.
Apa itu AEO Snippet Rerank Latency?
AEO Snippet Rerank Latency mengukur jeda waktu antara retrieval awal dan keputusan akhir pemilihan snippet oleh Rerank Model. Metrik ini menjadi sinyal penting untuk Answer Engine Optimization (AEO) karena AI Search seperti Perplexity dan Google AI Overview punya budget waktu terbatas per query.
Konteksnya, ketika user mengetik pertanyaan, retriever mengambil 30 sampai 200 kandidat. Rerank model lalu menilai relevansi tiap kandidat. Jika prosesnya lambat, AI Search akan memotong daftar kandidat lebih agresif, menurunkan peluang konten Anda terpilih.
Cara Kerja
| Tahap | Aktivitas | Kontribusi Latency |
|---|---|---|
| Retrieval | Ambil kandidat dari vector DB | 30 sampai 60 ms |
| Rerank | Skor ulang relevansi tiap kandidat | 80 sampai 150 ms |
| Selection | Pilih top-N untuk diserahkan ke LLM | 10 sampai 30 ms |
| Total | Akumulasi rerank latency | 120 sampai 240 ms |
Faktor pemengaruh utama: ukuran model rerank, panjang snippet, dan jumlah kandidat. Untuk pipeline RAG di Supabase Next.js, latency dapat ditekan dengan memendekkan snippet ke 200 sampai 300 token.
Kenapa Penting?
Untuk marketer dan pemilik personal brand, snippet yang dipilih AI Search adalah pintu utama AEO Snippet Quote Rate. Latency tinggi membuat snippet Anda tidak masuk shortlist. Berdasarkan pengamatan Vito Atmo pada klien personal branding sejak Februari 2026, menekan rerank latency dari 240 ke 140 ms menaikkan citation share sekitar 18 sampai 26 persen pada Perplexity.
Pertanyaan Umum
Bagaimana cara mengukur rerank latency?
Tambahkan timing log di lapisan rerank pipeline (sebelum dan sesudah model dipanggil). Untuk Supabase, log dapat dipasang di edge function yang menjalankan rerank.
Apakah memperpendek snippet selalu menurunkan latency?
Umumnya iya, tetapi terlalu pendek menurunkan AEO Snippet Stability Score. Targetkan panjang yang seimbang antara kecepatan dan konteks.