Digital Marketing
Multi-Armed Bandit
Multi-Armed Bandit (MAB) adalah algoritma eksperimen yang secara dinamis mengalihkan trafik ke varian yang menang sambil terus belajar, sehingga peluang konversi yang hilang lebih kecil dibanding A/B test klasik.
TL;DR: Multi-Armed Bandit adalah algoritma eksperimen yang secara otomatis memindahkan lebih banyak trafik ke varian yang berperforma baik sambil tetap mengeksplorasi varian lain. Berbeda dari A/B test klasik yang membagi trafik 50:50 sampai signifikansi tercapai, MAB menyeimbangkan eksplorasi dan eksploitasi sehingga total konversi yang hilang selama tes lebih kecil.
Apa itu Multi-Armed Bandit?
Istilah ini berasal dari analogi mesin slot di kasino yang punya banyak tuas (arm). Pemain harus memutuskan tuas mana yang ditarik supaya total hadiah maksimal, padahal payoff tiap tuas belum diketahui pasti. Dalam konteks marketing, setiap "arm" adalah varian halaman, headline, atau penawaran. Algoritma MAB menjalankan tradeoff antara mencoba arm baru (eksplorasi) dan menggunakan arm yang sudah terlihat menang (eksploitasi).
Dibanding [A/B Testing](/glosarium/ab-testing), MAB lebih cocok ketika biaya kehilangan konversi selama tes terasa mahal, misalnya pada landing iklan berbayar atau campaign musiman.
Cara Kerja Singkat
| Pendekatan | Cara Alokasi | Kapan Berhenti |
|---|---|---|
| A/B test klasik | 50:50 sampai signifikan | Setelah sample size tercapai |
| Epsilon-greedy MAB | 90% varian terbaik, 10% eksplorasi | Berjalan terus, tidak harus berhenti |
| Thompson Sampling | Probabilistik berbasis posterior | Berjalan terus dengan update Bayesian |
Thompson Sampling adalah varian MAB yang paling populer karena seimbang secara matematis dan tidak butuh tuning hyperparameter berat.
Kenapa Penting?
Untuk tim marketing Indonesia yang menjalankan iklan harian dengan budget terbatas, kehilangan konversi selama 2-4 minggu menunggu A/B test selesai bisa berarti kehilangan 10-20% revenue dari kampanye. MAB memangkas opportunity cost itu dengan memindahkan trafik lebih cepat. Trade-off-nya, MAB kurang cocok untuk eksperimen yang butuh kepastian statistik tinggi seperti perubahan harga atau fitur produk inti, di mana Incrementality test atau A/B test penuh tetap lebih tepat.
Pertimbangkan pakai Experimentation Platform yang sudah mendukung MAB native (LaunchDarkly, GrowthBook) sebelum membangun sendiri, karena implementasi sederhana sering gagal menangani drift dan seasonality.
Pertanyaan Umum
Apakah MAB selalu lebih baik daripada A/B test?
Tidak. MAB unggul saat tujuan utama adalah memaksimalkan konversi total selama eksperimen berjalan. Untuk pengujian yang butuh kesimpulan statistik kuat (misal validasi hipotesis produk), A/B test klasik tetap lebih tepat karena memberi p-value dan confidence interval yang jelas.
Berapa lama MAB butuh sample minimum?
Tidak ada batas minimum kaku, tapi praktik wajar di industri menyarankan minimal 1000-2000 konversi per arm sebelum algoritma stabil. Di bawah angka itu, hasil bisa bias karena noise.