Digital Marketing

Bandit Algorithm (Multi-Armed Bandit)

Vito Atmo·27 Mei 2026·0 kali dibaca·2 min baca

TL;DR: Bandit Algorithm adalah pendekatan eksperimen yang otomatis memindahkan traffic ke varian yang menang sambil tetap menyisakan sebagian kecil untuk eksplorasi. Dibanding A/B Testing klasik, bandit memangkas opportunity cost karena varian buruk berhenti dapat traffic lebih cepat.

Apa itu Bandit Algorithm?

Nama bandit berasal dari analogi mesin slot di Las Vegas yang punya banyak tuas (multi-armed), di mana pemain harus memutuskan tuas mana yang ditarik untuk memaksimalkan kemenangan. Dalam konteks marketing, setiap tuas adalah varian iklan, headline, atau landing page. Algoritma ini bekerja terus belajar mana varian terbaik sambil tetap mengeksplorasi varian baru.

Berbeda dengan Frequentist A/B Testing yang memerlukan sampel tetap dan analisis di akhir, bandit beradaptasi setiap kali ada konversi baru. Bagi marketer Indonesia, ini sangat berguna untuk eksperimen iklan Meta atau TikTok dengan budget terbatas, karena uang tidak terbuang di varian kalah.

Jenis Bandit Algorithm

Algoritma	Cara Kerja	Cocok Untuk
Epsilon-Greedy	Pilih winner 90 persen waktu, eksplor 10 persen	Eksperimen sederhana
Thompson Sampling	Sampling dari distribusi posterior Bayesian	Konversi rendah, butuh akurasi
UCB (Upper Confidence Bound)	Pilih berdasarkan upper bound interval	Konversi tinggi, eksplorasi cepat
Contextual Bandit	Mempertimbangkan konteks user (lokasi, device, jam)	Personalisasi real-time

Thompson Sampling adalah pilihan paling umum di tools modern seperti Vercel Edge Config, Statsig, dan Optimizely. Algoritma ini memberi keseimbangan terbaik antara eksplorasi dan eksploitasi.

Kenapa Penting?

Untuk marketer Indonesia dengan budget terbatas, bandit algorithm menjadi cara paling efisien menjalankan A/B Testing tanpa membakar uang di varian kalah. Riset Microsoft Research menunjukkan bandit dapat memangkas regret (kerugian dari memilih varian buruk) hingga 60 persen dibanding A/B Testing klasik dengan durasi sama. Per April 2026, hampir semua platform iklan besar (Meta, Google, TikTok) menggunakan bandit di balik layar untuk auction optimization.

Pertanyaan Umum

Apakah bandit menggantikan A/B Testing?

Tidak sepenuhnya. Bandit unggul untuk optimasi berkelanjutan, sedangkan A/B Testing klasik tetap dibutuhkan untuk hipotesis besar yang butuh kesimpulan statistik formal. Banyak tim menggunakan keduanya secara bergantian.

Apakah bandit cocok untuk eksperimen dengan traffic rendah?

Bisa, terutama Thompson Sampling, tapi tetap butuh minimal 100 konversi total agar algoritma punya cukup data belajar. Untuk traffic sangat rendah, pertimbangkan kembali ke A/B Testing klasik.

Istilah Terkait

A/B Testing Bayesian A/B Testing Cohort Analysis Conversion Rate

Semua Istilah Ada pertanyaan? →