Case Study

Studi Kasus Aris Setiawan: Pasang Agent Tool Degraded Mode di Asisten Konsultasi Hukum, Pangkas Sesi Gagal 47 Persen dan Hemat Biaya Inferensi 29 Persen Selama 35 Hari di 2026

Admin·30 Mei 2026·0 kali dibaca·4 min baca

TL;DR: Asisten AI konsultasi hukum milik Aris Setiawan sebelumnya kehilangan 18 persen sesi saat tool retrieval utama lambat atau overload. Setelah memasang Agent Tool Degraded Mode dengan tiga jalur fallback dan template respons terkurasi, sesi gagal turun 47 persen dan biaya inferensi hemat 29 persen dalam 35 hari pengamatan di Mei 2026.

Aris Setiawan menjalankan asisten AI publik untuk pertanyaan umum hukum perdata sebagai bagian dari personal brand profesionalnya. Volume sesi rata rata 800 sampai 1.200 per hari, dengan puncak di jam kerja. Tantangan utamanya bukan akurasi, melainkan stabilitas saat tool retrieval ke dokumen yurisprudensi mengalami latensi tinggi atau timeout.

Masalah: Sesi Gagal Saat Tool Utama Lambat

Sebelum perbaikan, asisten Aris pakai single path: setiap pertanyaan masuk dipanggilkan retrieval tool ke database putusan, lalu dilempar ke model premium untuk sintesis. Saat database lambat (terjadi 11 sampai 15 persen waktu di jam sibuk), sesi langsung melempar error generik ke user. Task completion rate stagnan di 76 persen, dan churn user untuk follow up turun.

Setelah analisis log, sumber masalah teridentifikasi: tidak ada Agent Tool Degraded Mode untuk menangani kondisi degradasi parsial. Setiap kegagalan tool langsung menjadi kegagalan sesi.

Solusi: Tiga Jalur Fallback Bertingkat

Konfigurasi degraded mode yang dipasang punya struktur jelas:

Jalur	Trigger	Tool yang Dipakai	Latensi Target
Primary	Default	Retrieval premium + model utama	Kurang dari 3 detik
Fallback 1	Latensi primary lebih dari 4 detik	Retrieval cache + model utama	Kurang dari 2 detik
Fallback 2	Error berturut 2 kali	Model ringan + summary cache	Kurang dari 1,5 detik
Degraded	Budget harian 90 persen	Template respons + saran kontak	Kurang dari 0,5 detik

Implementasi memakai pola Agent Tool Fallback Chain digabung Agent Tool Circuit Breaker. Threshold ditetapkan berdasarkan baseline log 14 hari sebelumnya.

Hasil Setelah 35 Hari

Tiga metrik utama dipantau via dashboard internal:

Task completion rate naik dari 76 ke 89 persen (delta 13 poin).
Sesi gagal turun dari 18 ke 9,5 persen, setara penurunan 47 persen relatif.
Biaya inferensi harian rata rata turun 29 persen karena 22 persen sesi sekarang ditangani jalur fallback yang lebih murah.

Yang menarik, user satisfaction score (diukur via thumbs up/down) justru naik 6 poin. Hipotesis kerjanya: user lebih puas dapat jawaban template singkat yang relevan daripada error generik.

Detail Implementasi yang Layak Dicatat

Tiga keputusan kunci yang membuat degraded mode jalan baik:

Pertama, template respons untuk jalur degraded ditulis ulang berdasarkan 200 pertanyaan tersering. Bukan generic "maaf sistem sibuk". Lebih ke "berdasarkan pertanyaan umum tentang X, jawaban singkatnya Y. Untuk konsultasi rinci, silakan kontak via Z".

Kedua, circuit breaker direset otomatis setiap 90 detik, bukan menunggu intervensi manual. Ini mencegah jalur primary terkunci terlalu lama setelah outage parsial selesai.

Ketiga, log degraded mode dipisah dari log error normal supaya tim bisa lihat berapa sering setiap jalur dipakai. Pola ini juga didokumentasikan baik di pola resiliensi Anthropic Claude tool use.

Pertanyaan Umum

Apakah pola ini cocok untuk asisten AI dengan volume rendah?

Cocok, terutama jika reliabilitas penting. Untuk volume di bawah 200 sesi per hari, cukup pasang 1 jalur fallback + template. Tidak perlu 3 jalur sekaligus.

Berapa biaya implementasi degraded mode?

Untuk asisten Aris, total waktu engineering sekitar 18 jam (analisis log, tulis template, integrasi, monitoring). Tidak ada biaya tool tambahan karena memakai infrastruktur eksisting.

Apakah user tahu sedang dalam mode degraded?

Ya, asisten Aris menampilkan badge halus "mode cepat aktif" saat fallback dipakai. Transparansi ini ternyata meningkatkan kepercayaan, bukan menurunkan.

Bagaimana memilih threshold latensi yang tepat?

Mulai dari percentile 90 baseline 14 hari. Untuk Aris, p90 latensi primary 3,2 detik, jadi threshold 4 detik masuk akal. Sesuaikan setelah 30 hari pengamatan.

Penutup: Resiliensi Adalah Fitur Produk

Degraded mode bukan workaround, melainkan fitur produk. Untuk personal brand profesional yang menjual jasa konsultasi via asisten AI, stabilitas selama jam sibuk justru jadi pembeda kompetitif. Investasi 18 jam engineering yang menghasilkan penurunan sesi gagal 47 persen termasuk return yang sangat masuk akal.

Butuh website yang benar-benar bekerja?

Hubungi Vito untuk konsultasi gratis 15 menit.

WhatsApp Sekarang