Digital Marketing
AEO Snippet Rerank Throughput
TL;DR: AEO Snippet Rerank Throughput adalah jumlah kandidat snippet yang dapat di-rerank per detik di pipeline AI Search (Perplexity, ChatGPT, Google AI Overview). Metrik ini menentukan seberapa banyak konten yang sempat dievaluasi ulang sebelum keputusan sitasi. Sweet spot untuk situs konten Indonesia: 80 hingga 180 snippet per detik per worker.
Apa itu AEO Snippet Rerank Throughput?
AEO Snippet Rerank Throughput mengukur kapasitas pipeline reranker untuk mengevaluasi ulang kandidat snippet sebelum AI Search memilih jawaban final. Pipeline retrieval biasanya menghasilkan 200 hingga 500 kandidat awal, tapi reranker tidak selalu sanggup memproses semua dalam latency budget yang aman. Throughput rendah membuat pipeline harus memangkas kandidat lebih awal, sehingga snippet otoritatif kadang gugur sebelum dinilai.
Konsep ini menjadi penting sejak 2024 saat ChatGPT, Perplexity, dan Google AI Overview mulai mengaktifkan reranker dua tahap. Pelajari konteks lebih luas di AEO snippet rerank coverage.
Cara Mengukur
Rumus throughput sederhana:
Throughput = Total kandidat yang berhasil di-rerank / Durasi (detik)
| Tingkat Throughput | Range Snippet per Detik | Dampak Sitasi |
|---|---|---|
| Rendah | Di bawah 40 | Sitasi turun 30 hingga 50 persen |
| Cukup | 40 hingga 80 | Sitasi stabil tapi rawan saat traffic naik |
| Sehat | 80 hingga 180 | Sitasi optimal, biaya wajar |
| Tinggi | Di atas 180 | Sitasi optimal tapi biaya melonjak |
Pendekatan yang Vito Atmo gunakan: ukur throughput di p50 dan p95, lalu sandingkan dengan AEO snippet rerank latency untuk melihat trade-off. Standar industri merujuk pada penelitian retrieval-augmented generation di [arXiv tentang reranking efisien](https://arxiv.org/abs/2305.02156).
Kenapa Penting?
Bagi marketer Indonesia yang ingin kontennya konsisten muncul di jawaban AI Search, throughput rendah berarti banyak snippet otoritatif tidak sempat dinilai dan dipotong di tahap awal. Sebagai konsekuensi, konten dengan otoritas substantif kalah dari konten cepat-load tapi tipis isi. Menjaga throughput di range 80 hingga 180 snippet per detik per worker terbukti menstabilkan sitasi tanpa membakar anggaran inferensi.
Pertanyaan Umum
Apakah throughput tinggi selalu lebih baik?
Tidak. Throughput di atas 200 sering berarti reranker kompromi pada kualitas scoring atau biaya inferensi melonjak. Cari titik seimbang dengan latency budget.
Bagaimana cara menaikkan throughput tanpa korbankan kualitas?
Optimasi sharding kandidat, gunakan reranker lebih ringan untuk tahap awal, dan terapkan AEO snippet rerank saturation sebagai cutoff dini.
Istilah Terkait