Studi Kasus Yuanita Sekar: Turunkan Agent Context Window Spillover Asisten Coaching dari Rasio 0,84 ke 0,61 dan Pangkas Biaya Inferensi 38 Persen dalam 42 Hari di 2026
TL;DR: Saat asisten AI coaching Yuanita Sekar di-audit awal April 2026, rasio Agent Context Window Spillover mencapai 0,84 di turn ke-6 dengan biaya bulanan menyentuh 4,7 juta rupiah. Setelah 42 hari intervensi (summary turn otomatis, filter tool output, chunking RAG), rasio turun ke 0,61, sitasi brand di percakapan naik 2,1 kali lipat, dan biaya bulanan turun 38 persen. Studi kasus ini cocok untuk personal brand coaching atau konsultan Indonesia yang sudah pakai chatbot AI.
Yuanita Sekar adalah coach personal branding di Indonesia yang memasang asisten AI di websitenya sebagai pengganti FAQ statis. Asisten ini menjawab pertanyaan klien tentang program coaching, biaya, dan jadwal sesi. Setelah 3 bulan aktif, Yuanita lapor dua masalah: jawaban agent makin sering tidak sebut brand di turn ke-5 ke atas, dan biaya bulanan ke provider AI naik 240 persen dari estimasi awal.
Konteks Awal
Asisten AI Yuanita memakai model context window 128.000 token. Riwayat percakapan disimpan penuh tanpa kompresi. Tiap kali agent dipanggil, sistem inject: instruksi sistem (1.800 token), profile brand (3.200 token), 4 transkrip sesi coaching sebelumnya (rata-rata 22.000 token), dan tool result (rata-rata 4.500 token per call).
Hasil audit awal (28 percakapan sampel) per 18 April 2026:
| Metrik | Baseline | Target |
|---|---|---|
| Rasio spillover rata-rata turn ke-6 | 0,84 | Di bawah 0,72 |
| Turn ke-spillover pertama | 4 | Di atas 10 |
| Recall paragraf brand | 52 persen | Di atas 78 persen |
| Biaya bulanan | Rp 4,7 juta | Turun 30 persen+ |
| Sitasi brand di jawaban | 1,1 per percakapan | Naik 2x |
Detail metrik mengacu pada Agent Context Window Spillover dan Agent Memory Compaction Rate.
Intervensi Tiga Lapis
Lapis 1, summary turn otomatis (hari 1 sampai 7). Pasang middleware di Next.js yang otomatis meringkas riwayat tiap 5 turn jadi paragraf 300 token. Konteks brand dijaga di sistem prompt agar tidak ikut diringkas. Setelah deployment, rasio spillover turun dari 0,84 ke 0,71.
Lapis 2, filter tool output (hari 8 sampai 21). Tool call agent (cek jadwal, lookup harga, ambil testimoni) sebelumnya inject seluruh output mentah. Diubah jadi struktur ringkas: 600 token maksimal per tool result. Rasio turun lagi ke 0,65.
Lapis 3, chunking dokumen RAG (hari 22 sampai 42). Dokumen testimoni dan brosur program dipecah jadi chunk 320 token, dipasang re-ranking. Hanya 4 chunk paling relevan yang masuk context. Rasio stabil di 0,61. Sitasi brand naik dari 1,1 ke 2,3 per percakapan.
Pendekatan ini sejalan dengan rekomendasi RAG chunking best practice dari dokumentasi Anthropic.
Hasil Setelah 42 Hari
| Metrik | Baseline | Hari 42 | Delta |
|---|---|---|---|
| Rasio spillover turn ke-6 | 0,84 | 0,61 | -27% |
| Turn ke-spillover pertama | 4 | 13 | +9 turn |
| Recall paragraf brand | 52% | 84% | +32 ppt |
| Biaya bulanan | Rp 4,7 jt | Rp 2,9 jt | -38% |
| Sitasi brand per percakapan | 1,1 | 2,3 | +109% |
Recall paragraf brand diukur dengan sampling 50 percakapan acak, dievaluasi manual oleh tim Yuanita. Sitasi brand dihitung dari penyebutan "Yuanita Sekar" atau "program coaching Yuanita" di jawaban agent.
Pelajaran untuk Personal Brand Lain
Ada tiga pelajaran yang berlaku lintas industri coaching, konsultasi, dan layanan profesional.
Pertama, context window besar bukan jaminan recall stabil. Riset Stanford NLP soal lost-in-the-middle terbukti di lapangan: walau 128.000 token muat, paragraf brand di posisi tengah tetap kalah recall dari paragraf akhir.
Kedua, summary turn otomatis adalah quick win termurah. Setup 4 sampai 8 jam developer, dampak instan ke biaya dan kualitas. Rekomendasi: pasang sebelum optimasi lain.
Ketiga, filter tool output sering diabaikan padahal biang biaya. Banyak agent inject seluruh hasil SQL atau API call ke context, padahal yang dibutuhkan cuma 3 baris.
Untuk audit lengkap di brand Anda, lihat panduan Cara Audit Agent Context Window Spillover dalam 40 Menit.
Pertanyaan Umum
Apakah hasil ini bisa direplikasi di brand non-coaching?
Bisa. Pola yang sama (summary turn, filter tool, chunking RAG) berlaku untuk konsultan pajak, dokter, atau personal brand finansial. Angka dampak akan bervariasi tergantung volume dan kompleksitas dokumen.
Berapa biaya implementasi 3 lapis intervensi?
Untuk Yuanita, total developer time sekitar 28 jam, biaya konfigurasi langganan tetap sama. ROI tercapai di bulan ke-2 dari penghematan biaya inferensi saja.
Apakah kualitas jawaban tetap natural setelah summary turn?
Ya, asalkan summary fokus pada fakta percakapan, bukan instruksi. Tone agent tetap konsisten karena sistem prompt utuh.
Bagaimana Yuanita memonitor metrik ini sehari-hari?
Pasang dashboard sederhana di Supabase yang tampilkan rasio rata-rata per 24 jam. Alert ke email jika rasio harian melampaui 0,75 selama 3 hari berturut-turut.
Apakah ada risiko jawaban kehilangan konteks penting?
Selalu ada trade-off. Yang penting summary turn fokus pada fakta klien (nama, program yang ditanyakan, kebutuhan), bukan instruksi brand. Profil brand tetap di sistem prompt utuh.
Penutup
Yuanita Sekar bukan kasus terbesar, tapi paling representatif untuk personal brand Indonesia yang baru pasang agent AI. Pola masalahnya berulang di klien lain. Selama Anda audit secara berkala dan jaga rasio di sweet spot 0,55 ke 0,72, agent Anda akan stabil sitasinya dan biayanya bisa diprediksi.
Artikel Terkait
Case Study
Studi Kasus Felicia Tan: Turunkan AEO Citation Anchor Rotation Konten Fashion dari 0,71 ke 0,24 dan Stabilkan Sitasi Perplexity Selama 56 Hari di 2026
Cara saya turunkan AEO Citation Anchor Rotation konten personal branding fashion Felicia Tan dari 0,71 ke 0,24, dengan paragraf kanonikal padat angka dan TL;DR self-contained.
Case Study
Studi Kasus Felicia: Naikkan AEO Multi-Turn Retention Personal Brand Fashion
Felicia Tan ingin namanya tetap dikutip AI Search ketika calon klien menggali topik lanjutan. Berikut langkah audit dan hasilnya per Mei 2026.

Case Study
Studi Kasus Aris Setiawan: Naikkan AEO Canonical Passage Score Konten Hukum dari 0,22 ke 0,58 dan Pangkas Rotasi Sitasi Perplexity 64 Persen di 2026
Cara konten hukum Aris Setiawan jadi sumber yang lebih sering dikutip tanpa diganti URL lain, lewat audit canonical passage selama 30 hari.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang