Case Study

Studi Kasus Atmo LMS: Pasang Agent Tool Circuit Breaker Window 120 Detik di Asisten Kurikulum, Pangkas Cascading Failure 67 Persen dan Hemat Biaya Inferensi Rp 7,4 Juta per Bulan dalam 34 Hari di 2026

Vito Atmo·31 Mei 2026·0 kali dibaca·4 min baca

Studi Kasus Atmo LMS: Pasang Agent Tool Circuit Breaker Window 120 Detik di Asisten Kurikulum, Pangkas Cascading Failure 67 Persen dan Hemat Biaya Inferensi Rp 7,4 Juta per Bulan dalam 34 Hari di 2026

TL;DR: Setelah satu episode cascading failure di asisten kurikulum Atmo LMS bulan April 2026, tim kami pasang Agent Tool Circuit Breaker Window 120 detik di empat tool downstream. Dalam 34 hari, cascading failure turun 67 persen, biaya inferensi turun Rp 7,4 juta per bulan, dan p95 latency sesi agen stabil di 760 ms. Catatan ini menjelaskan parameter, trade-off, dan langkah aplikasi di stack Next.js Supabase.

Asisten kurikulum Atmo LMS menangani 1.200 sesi per hari, sebagian besar pertanyaan siswa tentang materi modul. Pada awal April 2026, satu tool reranker eksternal mengalami timeout berturut-turut selama 14 menit. Agen tidak punya pemutus sirkit, retry terus berjalan, dan token konteks habis sebelum jawaban siap. Insiden itu menjadi pemicu pemasangan circuit breaker window.

Konteks Insiden

Reranker eksternal yang kami gunakan punya SLA 99,5 persen. Pada hari insiden, latency p99 melonjak dari 180 ms ke 8 detik. Agen, tanpa circuit breaker, terus memanggil reranker dan menumpuk retry budget sampai habis. Akibatnya 64 sesi gagal total dalam 14 menit, biaya inferensi spike Rp 1,2 juta hanya untuk retry storm. Pola kegagalan ini menyerupai apa yang didefinisikan di Agent Tool Retry Budget Burnout, tetapi pemicu inti bukan habisnya retry budget, melainkan tidak adanya pemutus eksplisit.

Parameter yang Diuji

Kami menjalankan ablation singkat selama 8 hari, menguji tiga konfigurasi window:

Window	Threshold Kegagalan	Hasil Cascading	Catatan
60 detik	4/10 panggilan	Turun 38 persen	Tool sering balik open karena belum sempat pulih
120 detik	5/10 panggilan	Turun 67 persen	Sweet spot untuk reranker
240 detik	5/10 panggilan	Turun 71 persen	Trafik sah tertahan, NPS turun

Window 120 detik dipilih sebagai default. Definisi parameter ini mengikuti pola yang dijelaskan di Agent Tool Circuit Breaker Window.

Eksekusi di Next.js Supabase

Implementasi dipasang di middleware tool client. Setiap pemanggilan tool dilewatkan melalui wrapper yang mencatat hasil ke tabel agent_tool_health. Saat window terbuka, wrapper mengembalikan fallback (cached answer atau "tool tidak tersedia, coba ulang") tanpa memanggil tool. Pendekatan ini berdampingan dengan Agent Tool Degradation Policy yang sudah lebih dulu kami pasang sejak Maret 2026.

Untuk monitoring, kami pasang dashboard di Supabase Studio yang membaca tabel kesehatan setiap 30 detik, mirip pola observability yang direkomendasikan Google SRE Handbook untuk sistem dengan dependency eksternal.

Hasil 34 Hari

Setelah pemasangan, indikator utama bergerak sebagai berikut:

Indikator	Sebelum	Sesudah	Perubahan
Cascading failure mingguan	18 episode	6 episode	-67 persen
Biaya inferensi bulanan	Rp 23,1 juta	Rp 15,7 juta	-Rp 7,4 juta
p95 latency sesi	1,4 detik	760 ms	-46 persen
Sesi gagal total	14 persen	4 persen	-10 poin

Penghematan biaya berasal dari dua sumber. Pertama, retry storm yang dipangkas. Kedua, sesi-sesi gagal yang dulu menelan token tanpa hasil sekarang dihentikan lebih awal lewat fallback. Hasil ini konsisten dengan studi kasus Atmo LMS terkait Degradation Policy yang juga menyoroti dampak pemutusan pada beban downstream.

Trade-Off

Tidak ada solusi resiliensi tanpa biaya. Window 120 detik berarti ada periode 2 menit di mana sebagian siswa mendapat pesan fallback alih-alih jawaban kontekstual. NPS asisten turun sementara 3 poin pada minggu pertama, tetapi pulih setelah copy fallback diperhalus. Angka ini bervariasi tergantung industri dan ukuran user base, jadi tim disarankan mengukur sendiri.

Pertanyaan Umum

Bisakah window terlalu pendek?

Bisa. Window 30 detik membiarkan agen kembali memanggil tool yang belum benar-benar pulih, memicu open-close-open dan menambah noise di logging. Kami sarankan minimum 60 detik untuk tool dengan recovery cepat.

Bagaimana cara menentukan threshold kegagalan?

Mulai dari 50 persen dari 10 panggilan terakhir. Sesuaikan turun bila tool punya volatilitas tinggi dan biaya retry mahal. Sesuaikan naik bila tool sering false-positive failure.

Apakah pendekatan ini bisa dipakai tanpa Supabase?

Bisa. Logika circuit breaker tidak tergantung database. Tabel agent_tool_health hanya untuk audit dan dashboard. Implementasi minimal cukup in-memory untuk single-instance.

Penutup

Cascading failure jarang datang dari satu titik. Biasanya satu tool yang lambat menyeret seluruh sesi agen ke jurang yang sama. Circuit breaker window adalah salah satu cara murah memutus rantai itu. Untuk tim yang menjalankan asisten LLM di produksi, parameter ini lebih layak diperdebatkan dibanding pilihan model.

Studi Kasus Yuanita Sekar: Pasang Agent Tool Session Affinity 12 Menit di Asisten Coaching, Pangkas Biaya Inferensi Rp 5,8 Juta per Bulan dan Naikkan Determinisme Sesi 0,94 dalam 35 Hari di 2026

Studi kasus lengkap implementasi Agent Tool Session Affinity dengan jendela 12 menit di asisten AI coaching Yuanita Sekar, hasil 35 hari: biaya inferensi turun Rp 5,8 juta per bulan dan determinisme sesi naik ke 0,94.

Case Study

Studi Kasus Atmo LMS: Pasang Agent Tool Degradation Policy Empat Tingkat di Asisten Kurikulum, Pangkas Sesi Gagal Total dari 14 ke 3 Persen dan Selamatkan Konversi Rp 18 Juta dalam 36 Hari di 2026

Studi kasus pemasangan Agent Tool Degradation Policy empat tingkat di asisten kurikulum Atmo LMS. Sesi gagal total turun dari 14 ke 3 persen dalam 36 hari.

Case Study

Studi Kasus Aris Setiawan: Pasang AEO Snippet Evidence Rotation 30 Hari di 18 Artikel Pilar Personal Branding, Pertahankan Sitasi Perplexity 0,9 per Minggu Selama 4 Bulan di 2026

Bagaimana rotasi bukti 30-hari pada 18 artikel pilar berhasil menahan laju decay sitasi Perplexity Aris Setiawan dari rata-rata 0,9 ke kisaran sehat selama 4 bulan tanpa menulis konten baru.

#atmo-lms#circuit-breaker#agent-tool#resilience#case-study

Butuh website yang benar-benar bekerja?

Hubungi Vito untuk konsultasi gratis 15 menit.

WhatsApp Sekarang