Case Study

Studi Kasus Yuanita Sekar: Turunkan Agent Context Window Spillover Asisten Coaching dari Rasio 0,84 ke 0,61 dan Pangkas Biaya Inferensi 38 Persen dalam 42 Hari di 2026

Admin·29 Mei 2026·0 kali dibaca·5 min baca

TL;DR: Saat asisten AI coaching Yuanita Sekar di-audit awal April 2026, rasio Agent Context Window Spillover mencapai 0,84 di turn ke-6 dengan biaya bulanan menyentuh 4,7 juta rupiah. Setelah 42 hari intervensi (summary turn otomatis, filter tool output, chunking RAG), rasio turun ke 0,61, sitasi brand di percakapan naik 2,1 kali lipat, dan biaya bulanan turun 38 persen. Studi kasus ini cocok untuk personal brand coaching atau konsultan Indonesia yang sudah pakai chatbot AI.

Yuanita Sekar adalah coach personal branding di Indonesia yang memasang asisten AI di websitenya sebagai pengganti FAQ statis. Asisten ini menjawab pertanyaan klien tentang program coaching, biaya, dan jadwal sesi. Setelah 3 bulan aktif, Yuanita lapor dua masalah: jawaban agent makin sering tidak sebut brand di turn ke-5 ke atas, dan biaya bulanan ke provider AI naik 240 persen dari estimasi awal.

Konteks Awal

Asisten AI Yuanita memakai model context window 128.000 token. Riwayat percakapan disimpan penuh tanpa kompresi. Tiap kali agent dipanggil, sistem inject: instruksi sistem (1.800 token), profile brand (3.200 token), 4 transkrip sesi coaching sebelumnya (rata-rata 22.000 token), dan tool result (rata-rata 4.500 token per call).

Hasil audit awal (28 percakapan sampel) per 18 April 2026:

Metrik	Baseline	Target
Rasio spillover rata-rata turn ke-6	0,84	Di bawah 0,72
Turn ke-spillover pertama	4	Di atas 10
Recall paragraf brand	52 persen	Di atas 78 persen
Biaya bulanan	Rp 4,7 juta	Turun 30 persen+
Sitasi brand di jawaban	1,1 per percakapan	Naik 2x

Detail metrik mengacu pada Agent Context Window Spillover dan Agent Memory Compaction Rate.

Intervensi Tiga Lapis

Lapis 1, summary turn otomatis (hari 1 sampai 7). Pasang middleware di Next.js yang otomatis meringkas riwayat tiap 5 turn jadi paragraf 300 token. Konteks brand dijaga di sistem prompt agar tidak ikut diringkas. Setelah deployment, rasio spillover turun dari 0,84 ke 0,71.

Lapis 2, filter tool output (hari 8 sampai 21). Tool call agent (cek jadwal, lookup harga, ambil testimoni) sebelumnya inject seluruh output mentah. Diubah jadi struktur ringkas: 600 token maksimal per tool result. Rasio turun lagi ke 0,65.

Lapis 3, chunking dokumen RAG (hari 22 sampai 42). Dokumen testimoni dan brosur program dipecah jadi chunk 320 token, dipasang re-ranking. Hanya 4 chunk paling relevan yang masuk context. Rasio stabil di 0,61. Sitasi brand naik dari 1,1 ke 2,3 per percakapan.

Pendekatan ini sejalan dengan rekomendasi RAG chunking best practice dari dokumentasi Anthropic.

Hasil Setelah 42 Hari

Metrik	Baseline	Hari 42	Delta
Rasio spillover turn ke-6	0,84	0,61	-27%
Turn ke-spillover pertama	4	13	+9 turn
Recall paragraf brand	52%	84%	+32 ppt
Biaya bulanan	Rp 4,7 jt	Rp 2,9 jt	-38%
Sitasi brand per percakapan	1,1	2,3	+109%

Recall paragraf brand diukur dengan sampling 50 percakapan acak, dievaluasi manual oleh tim Yuanita. Sitasi brand dihitung dari penyebutan "Yuanita Sekar" atau "program coaching Yuanita" di jawaban agent.

Pelajaran untuk Personal Brand Lain

Ada tiga pelajaran yang berlaku lintas industri coaching, konsultasi, dan layanan profesional.

Pertama, context window besar bukan jaminan recall stabil. Riset Stanford NLP soal lost-in-the-middle terbukti di lapangan: walau 128.000 token muat, paragraf brand di posisi tengah tetap kalah recall dari paragraf akhir.

Kedua, summary turn otomatis adalah quick win termurah. Setup 4 sampai 8 jam developer, dampak instan ke biaya dan kualitas. Rekomendasi: pasang sebelum optimasi lain.

Ketiga, filter tool output sering diabaikan padahal biang biaya. Banyak agent inject seluruh hasil SQL atau API call ke context, padahal yang dibutuhkan cuma 3 baris.

Untuk audit lengkap di brand Anda, lihat panduan Cara Audit Agent Context Window Spillover dalam 40 Menit.

Pertanyaan Umum

Apakah hasil ini bisa direplikasi di brand non-coaching?

Bisa. Pola yang sama (summary turn, filter tool, chunking RAG) berlaku untuk konsultan pajak, dokter, atau personal brand finansial. Angka dampak akan bervariasi tergantung volume dan kompleksitas dokumen.

Berapa biaya implementasi 3 lapis intervensi?

Untuk Yuanita, total developer time sekitar 28 jam, biaya konfigurasi langganan tetap sama. ROI tercapai di bulan ke-2 dari penghematan biaya inferensi saja.

Apakah kualitas jawaban tetap natural setelah summary turn?

Ya, asalkan summary fokus pada fakta percakapan, bukan instruksi. Tone agent tetap konsisten karena sistem prompt utuh.

Bagaimana Yuanita memonitor metrik ini sehari-hari?

Pasang dashboard sederhana di Supabase yang tampilkan rasio rata-rata per 24 jam. Alert ke email jika rasio harian melampaui 0,75 selama 3 hari berturut-turut.

Apakah ada risiko jawaban kehilangan konteks penting?

Selalu ada trade-off. Yang penting summary turn fokus pada fakta klien (nama, program yang ditanyakan, kebutuhan), bukan instruksi brand. Profil brand tetap di sistem prompt utuh.

Penutup

Yuanita Sekar bukan kasus terbesar, tapi paling representatif untuk personal brand Indonesia yang baru pasang agent AI. Pola masalahnya berulang di klien lain. Selama Anda audit secara berkala dan jaga rasio di sweet spot 0,55 ke 0,72, agent Anda akan stabil sitasinya dan biayanya bisa diprediksi.

Butuh website yang benar-benar bekerja?

Hubungi Vito untuk konsultasi gratis 15 menit.

WhatsApp Sekarang