Propensity Scoring untuk E-commerce Indonesia: Cara Skor Pelanggan agar Budget Iklan Tidak Terbuang 2026
TL;DR: Propensity Scoring adalah skor probabilitas tindakan pelanggan (umumnya pembelian) yang dipakai untuk memprioritaskan budget iklan, email, dan push notification. Brand e-commerce di Indonesia bisa mengarahkan 70-80% konversi dari hanya 20-30% audience teratas, sehingga CAC turun 15-25%.
Saat membantu tim Nalesha menata ulang kampanye retensi e-commerce parfum tahun lalu, masalahnya bukan kekurangan data. Database pelanggan sudah berisi ratusan ribu kontak. Masalahnya adalah seluruh database diblast dengan promo yang sama. Open rate jatuh ke 12%, dan unsubscribe naik. Solusinya bukan menambah data baru, melainkan membaca data yang sudah ada lebih cermat lewat propensity scoring.
Bagi marketer Indonesia yang masih berpikir machine learning adalah wilayah data scientist mahal, kabar baiknya: model propensity awal bisa dibangun dengan logistic regression sederhana di Postgres atau Python dengan akurasi yang sudah cukup untuk eksekusi. Yang menentukan hasil bukan kompleksitas model, melainkan disiplin memilih fitur.
Mengapa Blast Massal Tidak Lagi Layak di 2026
Sejak biaya iklan Meta dan Google Ads naik 18-25% tahun lalu di Indonesia (data eMarketer Q4 2025), strategi blast ke seluruh database menjadi pemborosan. Open rate email blast turun ke median 14-19% (data Mailmodo SEA 2025), sementara segmentasi propensity bisa mengangkatnya ke 28-34%. Praktik standar di industri menunjukkan kampanye yang menargetkan top 20% propensity score menghasilkan 50-70% dari total konversi. Angka ini bervariasi tergantung kualitas data dan kategori produk.
Sederhananya, budget iklan dan effort copywriting Anda sebaiknya tidak diratakan, melainkan dipertajam ke audience yang paling mungkin merespons.
Anatomi Model Propensity Sederhana
| Komponen | Pilihan Praktis |
|---|---|
| Target | Pembelian dalam 30 hari ke depan (binary 0/1) |
| Fitur transaksi | Recency, frequency, monetary, AOV |
| Fitur engagement | Email open rate, klik, kunjungan halaman |
| Fitur demografi | Kota, kategori favorit, channel akuisisi |
| Algoritma awal | Logistic regression, lalu gradient boosting |
| Evaluasi | AUC, precision-recall, lift curve |
Untuk e-commerce tahap awal, mulai dengan 8-12 fitur saja. Lebih banyak fitur bukan jaminan model lebih baik, justru sering bikin overfit. Logistic regression memberi koefisien yang gampang dibaca tim marketing.
Studi Kasus: Nalesha dan Top 20% Audience
Pada kuartal lalu, kami menyusun model propensity sederhana untuk Nalesha pakai Postgres dan Python di Supabase. Fitur yang dipilih ada delapan: recency pembelian terakhir, frekuensi pembelian 90 hari, average order value, jumlah produk berbeda yang pernah dibeli, email open rate 30 hari, klik landing page 30 hari, kategori parfum favorit, dan kota pengiriman.
Hasil model menempatkan 22% pelanggan di kuintil tertinggi. Saat kampanye Lebaran difokuskan ke kuintil ini, konversi mereka berkontribusi sekitar 68% dari total transaksi kampanye, dengan unsubscribe rate yang turun separuh dibanding blast tahun sebelumnya. Belanja iklan retargeting juga turun 21% karena audience yang dikirim ke Meta lebih sempit dan lebih tepat. Angka ini spesifik untuk Nalesha dan bukan jaminan untuk semua brand.
Cara Membangun Model Pertama Anda dalam 2 Minggu
Minggu pertama dipakai untuk menyiapkan data. Buat satu tabel customer-level dengan semua fitur dan kolom label "membeli dalam 30 hari" berdasarkan data historis. Jangan lupa hold out 20% data sebagai test set, sejalan dengan praktik standar dari Google's ML Crash Course.
Minggu kedua dipakai untuk melatih dan mengevaluasi. Mulai dengan logistic regression di scikit-learn atau statsmodels. Cek AUC (idealnya di atas 0.7 untuk model awal) dan lift curve pada top decile. Jika lift di top decile sudah 3-5x rata-rata, model ini sudah cukup untuk dipakai eksekusi.
Setelah model jalan, integrasikan output skor ke Customer Data Platform atau langsung ke email tool seperti Klaviyo atau Mailmodo. Buat segmen "Top 20% propensity 30 hari" dan jadikan default segment untuk kampanye akuisisi ulang.
Anti-pola yang Saya Hindari
Pertama, jangan kejar AUC 0.9 di iterasi pertama. Model dengan AUC 0.72 yang dieksekusi konsisten sudah memberi dampak besar. Kedua, jangan tambah fitur tanpa hipotesis bisnis di baliknya. Fitur "warna favorit website" jarang prediktif dan justru bisa menambah noise. Ketiga, jangan biarkan model statis lebih dari 12 minggu. Perilaku pelanggan berubah, model harus di-retrain berkala agar tidak mengalami drift.
Pertanyaan Umum
Apakah saya butuh data scientist untuk memulai?
Tidak. Marketer yang nyaman dengan SQL dan dasar Python bisa membangun model awal. Banyak founder Indonesia memulai dengan logistic regression sederhana sebelum merekrut data scientist.
Berapa minimum data pelanggan untuk model propensity?
Untuk logistic regression, minimal 1000 pelanggan dengan label positif (sudah pernah membeli) dan 1000 negatif. Untuk gradient boosting, idealnya 5000-10000 per kelas.
Apa beda Propensity Scoring dan RFM Segmentation?
RFM adalah segmentasi berbasis aturan tetap (recency, frequency, monetary) yang membagi pelanggan ke segmen statis. Propensity Scoring adalah skor kontinu yang memperkirakan probabilitas tindakan spesifik di masa depan. Banyak brand memakai keduanya bersamaan.
Apakah propensity scoring melanggar UU PDP?
Tidak otomatis melanggar. Pastikan pemrosesan data berbasis persetujuan eksplisit atau dasar kontrak yang sah, dan ada mekanisme penghapusan data sesuai UU PDP.
Ringkasan Aplikatif
Propensity Scoring bukan privilese brand besar dengan tim data scientist. Brand e-commerce Indonesia bisa memulai dengan model logistic regression sederhana, delapan sampai sepuluh fitur, dan tabel pelanggan yang sudah ada. Yang menentukan hasil bukan algoritma, melainkan disiplin retraining tiap kuartal dan keberanian memprioritaskan budget ke top 20% audience. Tiga kampanye disiplin sudah cukup untuk memindahkan CAC Anda ke arah yang lebih sehat.
Artikel Terkait

Digital Marketing
Cara Marketer Indonesia Audit AEO Citation Half-Life Konten Personal Branding dalam 60 Menit Pakai Spreadsheet, Targetkan Sweet Spot 28 ke 45 Hari di 2026
Audit AEO Citation Half-Life adalah cara mengukur seberapa lama satu sitasi bertahan di AI Search. Panduan praktis 60 menit pakai spreadsheet gratis.
Digital Marketing
Cara Marketer Indonesia Pakai Baseline 2026 untuk Pilih Fitur Web Modern yang Aman Dipakai di Produksi
Berhenti menebak fitur web mana yang aman dipakai. Baseline 2026 dari WebDX memberi label resmi siap produksi. Panduan singkat dengan contoh keputusan.
Digital Marketing
Engagement Rate vs CTR: Mana yang Lebih Relevan untuk Marketer Indonesia 2026
Engagement Rate dan CTR sering disamakan padahal mengukur hal yang berbeda. Panduan praktis kapan pakai ER, kapan pakai CTR, dan kenapa pemilihan metrik salah bikin kampanye keliru.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang