Digital Marketing

AEO Snippet Rerank Throughput

Vito Atmo
Vito Atmo·31 Mei 2026·0 kali dibaca·2 min baca

TL;DR: AEO Snippet Rerank Throughput adalah jumlah kandidat snippet yang dapat di-rerank per detik di pipeline AI Search (Perplexity, ChatGPT, Google AI Overview). Metrik ini menentukan seberapa banyak konten yang sempat dievaluasi ulang sebelum keputusan sitasi. Sweet spot untuk situs konten Indonesia: 80 hingga 180 snippet per detik per worker.

Apa itu AEO Snippet Rerank Throughput?

AEO Snippet Rerank Throughput mengukur kapasitas pipeline reranker untuk mengevaluasi ulang kandidat snippet sebelum AI Search memilih jawaban final. Pipeline retrieval biasanya menghasilkan 200 hingga 500 kandidat awal, tapi reranker tidak selalu sanggup memproses semua dalam latency budget yang aman. Throughput rendah membuat pipeline harus memangkas kandidat lebih awal, sehingga snippet otoritatif kadang gugur sebelum dinilai.

Konsep ini menjadi penting sejak 2024 saat ChatGPT, Perplexity, dan Google AI Overview mulai mengaktifkan reranker dua tahap. Pelajari konteks lebih luas di AEO snippet rerank coverage.

Cara Mengukur

Rumus throughput sederhana:

ini
Throughput = Total kandidat yang berhasil di-rerank / Durasi (detik)
Tingkat ThroughputRange Snippet per DetikDampak Sitasi
RendahDi bawah 40Sitasi turun 30 hingga 50 persen
Cukup40 hingga 80Sitasi stabil tapi rawan saat traffic naik
Sehat80 hingga 180Sitasi optimal, biaya wajar
TinggiDi atas 180Sitasi optimal tapi biaya melonjak

Pendekatan yang Vito Atmo gunakan: ukur throughput di p50 dan p95, lalu sandingkan dengan AEO snippet rerank latency untuk melihat trade-off. Standar industri merujuk pada penelitian retrieval-augmented generation di [arXiv tentang reranking efisien](https://arxiv.org/abs/2305.02156).

Kenapa Penting?

Bagi marketer Indonesia yang ingin kontennya konsisten muncul di jawaban AI Search, throughput rendah berarti banyak snippet otoritatif tidak sempat dinilai dan dipotong di tahap awal. Sebagai konsekuensi, konten dengan otoritas substantif kalah dari konten cepat-load tapi tipis isi. Menjaga throughput di range 80 hingga 180 snippet per detik per worker terbukti menstabilkan sitasi tanpa membakar anggaran inferensi.

Pertanyaan Umum

Apakah throughput tinggi selalu lebih baik?

Tidak. Throughput di atas 200 sering berarti reranker kompromi pada kualitas scoring atau biaya inferensi melonjak. Cari titik seimbang dengan latency budget.

Bagaimana cara menaikkan throughput tanpa korbankan kualitas?

Optimasi sharding kandidat, gunakan reranker lebih ringan untuk tahap awal, dan terapkan AEO snippet rerank saturation sebagai cutoff dini.

Bagikan