Digital Marketing
Bandit Algorithm (Multi-Armed Bandit)
TL;DR: Bandit Algorithm adalah pendekatan eksperimen yang otomatis memindahkan traffic ke varian yang menang sambil tetap menyisakan sebagian kecil untuk eksplorasi. Dibanding A/B Testing klasik, bandit memangkas opportunity cost karena varian buruk berhenti dapat traffic lebih cepat.
Apa itu Bandit Algorithm?
Nama bandit berasal dari analogi mesin slot di Las Vegas yang punya banyak tuas (multi-armed), di mana pemain harus memutuskan tuas mana yang ditarik untuk memaksimalkan kemenangan. Dalam konteks marketing, setiap tuas adalah varian iklan, headline, atau landing page. Algoritma ini bekerja terus belajar mana varian terbaik sambil tetap mengeksplorasi varian baru.
Berbeda dengan Frequentist A/B Testing yang memerlukan sampel tetap dan analisis di akhir, bandit beradaptasi setiap kali ada konversi baru. Bagi marketer Indonesia, ini sangat berguna untuk eksperimen iklan Meta atau TikTok dengan budget terbatas, karena uang tidak terbuang di varian kalah.
Jenis Bandit Algorithm
| Algoritma | Cara Kerja | Cocok Untuk |
|---|---|---|
| Epsilon-Greedy | Pilih winner 90 persen waktu, eksplor 10 persen | Eksperimen sederhana |
| Thompson Sampling | Sampling dari distribusi posterior Bayesian | Konversi rendah, butuh akurasi |
| UCB (Upper Confidence Bound) | Pilih berdasarkan upper bound interval | Konversi tinggi, eksplorasi cepat |
| Contextual Bandit | Mempertimbangkan konteks user (lokasi, device, jam) | Personalisasi real-time |
Thompson Sampling adalah pilihan paling umum di tools modern seperti Vercel Edge Config, Statsig, dan Optimizely. Algoritma ini memberi keseimbangan terbaik antara eksplorasi dan eksploitasi.
Kenapa Penting?
Untuk marketer Indonesia dengan budget terbatas, bandit algorithm menjadi cara paling efisien menjalankan A/B Testing tanpa membakar uang di varian kalah. Riset Microsoft Research menunjukkan bandit dapat memangkas regret (kerugian dari memilih varian buruk) hingga 60 persen dibanding A/B Testing klasik dengan durasi sama. Per April 2026, hampir semua platform iklan besar (Meta, Google, TikTok) menggunakan bandit di balik layar untuk auction optimization.
Pertanyaan Umum
Apakah bandit menggantikan A/B Testing?
Tidak sepenuhnya. Bandit unggul untuk optimasi berkelanjutan, sedangkan A/B Testing klasik tetap dibutuhkan untuk hipotesis besar yang butuh kesimpulan statistik formal. Banyak tim menggunakan keduanya secara bergantian.
Apakah bandit cocok untuk eksperimen dengan traffic rendah?
Bisa, terutama Thompson Sampling, tapi tetap butuh minimal 100 konversi total agar algoritma punya cukup data belajar. Untuk traffic sangat rendah, pertimbangkan kembali ke A/B Testing klasik.