Digital Transformation
Token Budget (Anggaran Token Konteks AI)
Token Budget adalah batas total token yang bisa diproses model bahasa dalam satu permintaan, menentukan seberapa banyak konten brand muat di konteks jawaban AI Search.
TL;DR: Token Budget adalah anggaran token yang dimiliki model bahasa untuk satu permintaan, mencakup prompt sistem, kueri pengguna, konteks dokumen, dan jawaban. Marketer perlu paham angka ini karena konten yang terlalu panjang atau strukturnya berantakan akan terpotong dan kehilangan peluang dikutip AI.
Apa itu Token Budget?
Token Budget adalah jumlah maksimum token yang dapat dimuat oleh sebuah model dalam satu sesi inferensi. Token bukan kata, melainkan unit subkata yang dipakai model untuk memetakan teks ke vektor. Satu kata bahasa Indonesia rata-rata sama dengan 1,3-1,7 token, sementara kalimat dengan banyak istilah teknis bisa lebih boros. Anggaran ini dipakai untuk semua bagian: instruksi sistem, riwayat percakapan, dokumen yang ditarik dari Dense Retrieval, dan jawaban yang dihasilkan. Lihat juga Context Window untuk istilah yang sering dipertukarkan.
Komponen yang Memakan Token
| Komponen | Porsi Tipikal |
|---|---|
| Prompt sistem dan instruksi | 5-15% |
| Kueri dan riwayat | 5-20% |
| Dokumen dari retrieval | 50-70% |
| Ruang jawaban | 15-25% |
Saat anggaran habis, model akan memotong dokumen lebih dulu, biasanya bagian akhir. Itu sebabnya kalimat kunci, definisi, dan angka penting harus muncul di awal dokumen, bukan di kesimpulan.
Kenapa Penting bagi Marketer?
Konten yang dirancang untuk AI Search harus efisien per token. Praktik yang saya pakai di proyek konten klien: TL;DR di paragraf pertama, definisi padat di kalimat kedua, dan struktur heading yang ramah pemecahan (Chunk Overlap). Konten yang efisien lebih sering masuk konteks, lebih sering dikutip, dan lebih hemat biaya saat dipakai sebagai sumber agen AI internal.
Pertanyaan Umum
Apakah token sama dengan kata?
Tidak. Token adalah unit subkata. Kata pendek seperti "data" biasanya satu token, tetapi kata panjang atau istilah Indonesia seperti "pengoptimalan" bisa pecah jadi 3-4 token.
Berapa token rata-rata model AI saat ini?
Per Mei 2026 model utama bekerja di rentang 128 ribu hingga 1 juta token, tetapi anggaran efektif yang dipakai untuk konteks dokumen biasanya jauh lebih kecil karena alasan biaya dan kecepatan.
Istilah Terkait