Digital Marketing
Agent Memory Compaction Rate
TL;DR: Agent Memory Compaction Rate adalah rasio antara ukuran context window sesudah kompaksi otomatis dibanding sebelum kompaksi, dinyatakan dalam persen. Skor sehat 35 hingga 60 persen. Terlalu rendah berarti konteks penting hilang, terlalu tinggi berarti hemat biaya gagal tercapai.
Apa itu Agent Memory Compaction Rate?
Agent Memory Compaction Rate adalah metrik yang muncul seiring popularitas AI agent berbasis API seperti Claude Agent SDK dan OpenAI Agents. Saat percakapan panjang, agent perlu meringkas riwayat lama menjadi summary singkat agar tidak melampaui context limit. Rasio ini mengukur seberapa agresif kompaksi tersebut. Konsep terkait: Agent Context Budget Overflow yang mengukur seberapa sering konteks meluap.
Cara Menghitung dan Threshold
Rumus: (compacted_tokens / original_tokens) * 100.
| Rate | Interpretasi |
|---|---|
| Di bawah 25% | Terlalu agresif, risiko kehilangan instruksi |
| 25 hingga 35% | Agresif, cocok untuk percakapan panjang |
| 35 hingga 60% | Sehat, keseimbangan biaya dan kualitas |
| 60 hingga 80% | Konservatif, biaya token tinggi |
| Di atas 80% | Tidak efisien, kompaksi gagal |
Kenapa Penting untuk Marketer?
Marketer yang membangun chatbot customer service atau AI content assistant perlu memantau metrik ini agar biaya per percakapan terkendali. Dalam pengalaman Vito Atmo memprototipekan AI agent untuk klien e-commerce, compaction rate yang dijaga di 40 hingga 55 persen menurunkan biaya token rata-rata 38 persen tanpa kehilangan konteks order pelanggan. Dokumentasi Anthropic Agent SDK menjelaskan cara konfigurasi threshold ini.
Pertanyaan Umum
Apa beda Compaction Rate dengan Truncation?
Compaction meringkas konteks lama jadi summary yang masih bermakna. Truncation memotong begitu saja tanpa ringkasan, lebih berisiko kehilangan informasi.
Apakah semua agent platform support?
Belum. Per April 2026, Claude Agent SDK dan LangGraph sudah support otomatis. Platform lain butuh implementasi manual.
Istilah Terkait