Digital Marketing

Multi-Armed Bandit

Multi-Armed Bandit (MAB) adalah algoritma eksperimen yang secara dinamis mengalihkan trafik ke varian yang menang sambil terus belajar, sehingga peluang konversi yang hilang lebih kecil dibanding A/B test klasik.

Vito Atmo
Vito Atmo·29 April 2026·0 kali dibaca·3 min baca

TL;DR: Multi-Armed Bandit adalah algoritma eksperimen yang secara otomatis memindahkan lebih banyak trafik ke varian yang berperforma baik sambil tetap mengeksplorasi varian lain. Berbeda dari A/B test klasik yang membagi trafik 50:50 sampai signifikansi tercapai, MAB menyeimbangkan eksplorasi dan eksploitasi sehingga total konversi yang hilang selama tes lebih kecil.

Apa itu Multi-Armed Bandit?

Istilah ini berasal dari analogi mesin slot di kasino yang punya banyak tuas (arm). Pemain harus memutuskan tuas mana yang ditarik supaya total hadiah maksimal, padahal payoff tiap tuas belum diketahui pasti. Dalam konteks marketing, setiap "arm" adalah varian halaman, headline, atau penawaran. Algoritma MAB menjalankan tradeoff antara mencoba arm baru (eksplorasi) dan menggunakan arm yang sudah terlihat menang (eksploitasi).

Dibanding [A/B Testing](/glosarium/ab-testing), MAB lebih cocok ketika biaya kehilangan konversi selama tes terasa mahal, misalnya pada landing iklan berbayar atau campaign musiman.

Cara Kerja Singkat

PendekatanCara AlokasiKapan Berhenti
A/B test klasik50:50 sampai signifikanSetelah sample size tercapai
Epsilon-greedy MAB90% varian terbaik, 10% eksplorasiBerjalan terus, tidak harus berhenti
Thompson SamplingProbabilistik berbasis posteriorBerjalan terus dengan update Bayesian

Thompson Sampling adalah varian MAB yang paling populer karena seimbang secara matematis dan tidak butuh tuning hyperparameter berat.

Kenapa Penting?

Untuk tim marketing Indonesia yang menjalankan iklan harian dengan budget terbatas, kehilangan konversi selama 2-4 minggu menunggu A/B test selesai bisa berarti kehilangan 10-20% revenue dari kampanye. MAB memangkas opportunity cost itu dengan memindahkan trafik lebih cepat. Trade-off-nya, MAB kurang cocok untuk eksperimen yang butuh kepastian statistik tinggi seperti perubahan harga atau fitur produk inti, di mana Incrementality test atau A/B test penuh tetap lebih tepat.

Pertimbangkan pakai Experimentation Platform yang sudah mendukung MAB native (LaunchDarkly, GrowthBook) sebelum membangun sendiri, karena implementasi sederhana sering gagal menangani drift dan seasonality.

Pertanyaan Umum

Apakah MAB selalu lebih baik daripada A/B test?

Tidak. MAB unggul saat tujuan utama adalah memaksimalkan konversi total selama eksperimen berjalan. Untuk pengujian yang butuh kesimpulan statistik kuat (misal validasi hipotesis produk), A/B test klasik tetap lebih tepat karena memberi p-value dan confidence interval yang jelas.

Berapa lama MAB butuh sample minimum?

Tidak ada batas minimum kaku, tapi praktik wajar di industri menyarankan minimal 1000-2000 konversi per arm sebelum algoritma stabil. Di bawah angka itu, hasil bisa bias karena noise.

Bagikan