Studi Kasus Atmo LMS: Pasang Agent Tool Cancellation Budget 2 per Sesi di Asisten Kurikulum, Pangkas Cascading Retry 58 Persen dan Hemat Inferensi Rp 5,9 Juta per Bulan dalam 33 Hari di 2026
TL;DR: Asisten kurikulum Atmo LMS mengalami cascading retry akut setelah user mulai sering membatalkan eksekusi tool transaksional. Implementasi Agent Tool Cancellation Budget 2 cancellation per sesi 12 menit memangkas cascading retry 58 persen dan menghemat inferensi Rp 5,9 juta per bulan dalam 33 hari. Solusinya bukan menambah retry, justru membatasi cancellation.
Saat membangun asisten kurikulum Atmo LMS, tim observasi pola yang aneh: biaya inferensi naik 31 persen di minggu ke-5 padahal jumlah sesi user stagnan. Setelah audit, ternyata penyebabnya bukan model upgrade, tapi loop cancel-retry yang silent. User membatalkan tool di tengah, agent mencoba ulang, gagal lagi, retry lagi. Per April 2026, pola ini disebut cascading retry storm di dokumentasi AWS Builders Library, dan biaya silentnya bisa 2-3 kali baseline.
Artikel ini membedah implementasi Agent Tool Cancellation Budget di pipeline Atmo LMS, lengkap dengan threshold dan dampaknya.
Masalah: Loop Cancel-Retry yang Tidak Terlihat
Asisten kurikulum Atmo LMS punya tool transaksional: enroll-student, schedule-class, send-reminder. User behavior yang sering: mulai enroll, ragu, klik back, lalu coba enroll lagi dari awal. Tool yang sedang berjalan ter-cancel mid-flight, state setengah tertulis, retry trigger, dan agent mencoba lagi dengan konteks yang sudah corrupt.
Telemetry awal:
| Metrik | Sebelum |
|---|---|
| Cancellation per sesi | 4,2 rata-rata |
| Retry rate setelah cancel | 78 persen |
| Cost overhead per sesi | Rp 380 ekstra |
| p95 latency sesi | 2,4 detik |
Solusi: Cancellation Budget 2 per Sesi
Tim memasang budget 2 cancellation per sesi 12 menit. Setelah budget habis, sistem masuk state saturated dan trigger Agent Tool Circuit Breaker Window selama 90 detik. Selama window ini, request baru otomatis fallback ke Agent Tool Degradation Policy tingkat 2 (manual confirm step, no auto-retry).
Implementasi di Next.js Supabase:
async function checkCancellationBudget(sessionId: string) {
const { count } = await supabase
.from("tool_cancellations")
.select("*", { count: "exact" })
.eq("session_id", sessionId)
.gte("created_at", new Date(Date.now() - 12 * 60 * 1000).toISOString());
return count < 2;
}
Pipeline juga ditambahkan LLM Context Rotation Budget 18 persen supaya konteks instruksi sistem tetap pinned saat circuit breaker aktif.
Hasil
Setelah 33 hari observasi:
| Metrik | Sebelum | Sesudah | Delta |
|---|---|---|---|
| Cancellation per sesi | 4,2 | 1,6 | -62% |
| Retry rate setelah cancel | 78% | 32% | -46pp |
| Cascading retry events | 124/hari | 52/hari | -58% |
| Biaya inferensi/bulan | Rp 18,4 jt | Rp 12,5 jt | -Rp 5,9 jt |
| p95 latency sesi | 2,4 detik | 1,4 detik | -42% |
Dampak sekunder: support ticket terkait "asisten lambat merespon" turun 41 persen.
Pelajaran
Tiga insight aplikatif yang bisa dipakai marketer dan developer Indonesia:
Pertama, cascading retry sering invisible di dashboard biasa karena setiap retry kelihatan sukses individual. Telemetry per-sesi penting. Kedua, solusi intuitif (tambah retry budget) justru memperparah, batasi cancellation lebih efektif. Ketiga, pasangkan dengan LLM Citation Decay tracking untuk konten dokumentasi tool, supaya user pakai versi tool yang aktual.
Pertanyaan Umum
Apakah budget 2 berlaku universal?
Tidak. Atmo LMS sesi-nya rata-rata 12 menit dengan 3-4 tool calls. Untuk asisten dengan sesi lebih panjang (booking kompleks, konsultasi), budget bisa naik ke 3-4 per sesi.
Apa yang terjadi jika user butuh cancel lebih dari 2 kali?
Saat budget habis, sistem masuk degradation tingkat 2: setiap aksi butuh manual confirm dari user. User tetap bisa lanjut, tapi tanpa auto-retry. Ini lebih lambat tapi state-nya konsisten.
Bagaimana cara monitor cascading retry?
Tabel tool_cancellations di Supabase plus dashboard yang plot ratio retry-after-cancel per sesi. Threshold alert: ratio di atas 50 persen sustained 3 hari.
Penutup
Cancellation Budget sederhana, tapi dampaknya bisa signifikan untuk pipeline agent yang sudah scale. Yang menarik di Atmo LMS, perbaikan ini juga menaikkan trust user, mereka melihat sistem yang stabil walau lebih konservatif.
Artikel Terkait
Case Study
Studi Kasus Yuanita Sekar: Kalibrasi Agent Tool Failover Bias dari 0,42 ke 0,62 di Asisten Coaching, Pangkas Sesi Gagal Booking dari 18 ke 5 Persen dan Selamatkan Konversi Rp 11,2 Juta per Bulan dalam 34 Hari di 2026
Catatan kalibrasi Agent Tool Failover Bias dari 0,42 ke 0,62 di asisten coaching Yuanita Sekar. Sesi gagal booking turun dari 18 ke 5 persen, konversi selamat Rp 11,2 juta per bulan, false positive di bawah 4 persen dalam 34 hari.
Case Study
Studi Kasus Ade Mulyana: Pasang LLM Context Pinning Budget 22 Persen di Asisten Konsultan Pajak, Pangkas Fact Drift dari 28 ke 4 Persen dan Selamatkan Konversi Rp 14 Juta per Bulan dalam 34 Hari di 2026
Studi kasus pasang LLM Context Pinning Budget 22 persen window di asisten konsultan pajak Ade Mulyana, pangkas fact drift 24 poin dan selamatkan konversi Rp 14 juta per bulan.
Case Study
Studi Kasus Atmo LMS: Pasang Agent Tool Deadline Budget 1.000 ms dan LLM Context Compaction Window 180 Detik di Asisten Kurikulum, Pangkas p95 Latency 47 Persen dan Hemat Inferensi Rp 6,1 Juta per Bulan dalam 31 Hari di 2026
Asisten kurikulum Atmo LMS sempat membakar token dan menyentuh p95 latency 1,9 detik. Setelah pemasangan deadline budget plus jendela kompaksi konteks, p95 turun ke 1,0 detik dan biaya inferensi hemat Rp 6,1 juta per bulan dalam 31 hari.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang