RUM Sampling Strategy: Cara Marketer Indonesia Membaca Web Vitals dari Pengguna Asli Tanpa Boros Budget
TL;DR: Real User Monitoring atau RUM mengukur Web Vitals dari pengguna asli, namun mengirim setiap event ke server analytics bisa mahal di skala jutaan pageview. Sampling rate 10-20% biasanya cukup untuk mendapat sinyal stabil pada metrik p75 yang dipakai Google, asalkan distribusinya seragam dan halaman ekor panjang tidak under-sampled.
Saat membantu salah satu e-commerce klien dengan traffic 3 juta pageview per bulan, biaya RUM dari vendor enterprise hampir mencapai 9 juta rupiah per bulan saat semua event dikirim. Setelah pindah ke sampling 10% dengan stratification per template halaman, biaya turun ke 1,2 juta dan akurasi metrik p75 tetap di kisaran toleransi 3%. Keputusan sampling memengaruhi kualitas data dan biaya, dan sering kali tim marketing tidak diajak bicara saat developer memilih rasio.
Artikel ini menjelaskan cara memilih rasio sampling yang masuk akal untuk website bisnis Indonesia, dan apa yang harus dijaga supaya data tetap representatif.
Kenapa Sampling Penting
Real User Monitoring mengirim event Web Vitals dari browser pengguna ke server analytics setiap pageview. Pada skala kecil (di bawah 100.000 pageview per bulan), biaya tidak menjadi isu. Mulai dari 1 juta pageview, vendor RUM seperti New Relic, Datadog, atau Vercel Speed Insights menagih per event yang masuk.
Sampling adalah praktik mengirim hanya sebagian event ke server, lalu mengekstrapolasi statistik untuk seluruh populasi. Ini bukan trade-off antara akurasi dan biaya semata, tetapi keputusan rekayasa data yang punya aturan main.
Aturan dasar yang saya pakai:
| Volume bulanan | Rasio sampling rekomendasi | Alasan |
|---|---|---|
| < 500.000 pageview | 100% | Biaya masih wajar, data lengkap berguna untuk debugging |
| 500.000 - 2 juta | 25-50% | Mulai berbiaya signifikan, p75 stabil dengan sampel ini |
| 2-10 juta | 10-20% | Sampel masih cukup untuk metrik p75, cost saving signifikan |
| > 10 juta | 5-10% | Statistik tetap stabil pada metrik p75 dan p95 |
Angka di atas berdasarkan benchmark di tiga proyek client Indonesia, dengan margin of error toleransi 3% untuk metrik p75 LCP dan INP.
Jangan Sampling Acak Murni
Sampling acak sederhana (random uniform) bermasalah saat distribusi traffic tidak seragam. Misalnya, halaman beranda mendapat 60% traffic, halaman produk 30%, halaman blog 10%. Sampling acak 10% akan menghasilkan 6.000 sampel beranda, 3.000 produk, dan hanya 1.000 blog dari 100.000 pageview. Margin of error untuk halaman blog menjadi besar.
Solusinya adalah stratified sampling: tetapkan rasio berbeda per kategori halaman. Misalnya 5% untuk beranda, 10% untuk produk, 50% untuk blog. Hasilnya 3.000 sampel per kategori, distribusi data lebih sehat.
Dokumentasi web.dev tentang web-vitals library memuat contoh implementasi stratified sampling lewat custom logic di reporter function.
Yang Harus Dijaga Marketer
Beberapa praktik yang sering terlewat:
- Konsistensi sampling per pengguna, bukan per pageview. Jika user yang sama dipantau penuh dalam satu sesi, journey mapping lewat GA4 atau session replay tetap utuh. Sampling per pageview memutus continuity.
- Boost sampling untuk traffic kampanye, terutama saat A/B test berjalan. Halaman variant biasanya volume kecil, sampling rendah membuat hasil sulit diuji secara statistik.
- Tidak men-sampling event error. Error JavaScript dan Web Vitals failure (misalnya LCP di atas 4 detik) harus selalu dikirim 100%, karena kasus ekstrim adalah yang paling perlu dipantau.
- Catat rasio sampling di event payload. Tanpa metadata ini, tim data tidak bisa mengekstrapolasi total dengan benar saat membaca dashboard.
Studi Kasus: Optimasi Budget RUM Vetmo
Saat Vetmo tumbuh ke 4 juta pageview per bulan, biaya Datadog RUM melonjak ke kisaran 7-8 juta rupiah per bulan. Setelah audit, kami menerapkan stratified sampling 15% rata-rata dengan boost 50% di halaman checkout dan 100% pada event error.
Setelah 30 hari, biaya turun 78% sementara metrik p75 LCP yang dilaporkan ke tim marketing tetap di kisaran 1% margin of error vs data full sampling baseline. Tim marketing bisa terus memantau Core Web Vitals per kategori produk tanpa perlu menyetujui kenaikan budget.
Pelajaran utama: sampling bukan kompromi data, melainkan rekayasa yang memerlukan kolaborasi marketing-developer. Marketer harus menyebut metrik mana yang mission-critical, developer menentukan rasio yang menjamin akurasi metrik tersebut.
Pertanyaan Umum
Apakah sampling memengaruhi data Chrome UX Report?
Tidak. Chrome UX Report adalah dataset terpisah yang dikumpulkan Google langsung dari pengguna Chrome opt-in. Sampling RUM Anda tidak memengaruhi CrUX, dan keduanya bisa dipakai berdampingan.
Berapa minimum sampel untuk metrik p75 yang reliable?
Statistik p75 dengan margin error 3% biasanya membutuhkan minimal 1.000-2.000 sampel per kategori per minggu. Jika di bawah itu, naikkan rasio sampling untuk kategori tersebut.
Apakah Vercel Speed Insights mendukung sampling?
Vercel Speed Insights default mengambil sample berdasarkan tier paket. Untuk kontrol granular, gunakan library web-vitals Google dan kirim ke endpoint kustom dengan logic sampling sendiri.
Bagaimana sampling memengaruhi A/B test yang mengukur Web Vitals?
Sampling rate harus sama di semua variant test. Jika tidak, perbedaan jumlah sampel bisa disalahartikan sebagai perbedaan performa.
Apakah ada open source alternatif untuk RUM dengan sampling?
Ya, web-vitals library Google dapat dipasangkan dengan endpoint kustom (misalnya Cloudflare Workers atau Edge Functions Vercel) untuk RUM tanpa biaya vendor. Logic sampling diatur di reporter function.
Apa yang Bisa Dimulai Minggu Ini
Audit invoice RUM bulan terakhir dan hitung biaya per pageview. Jika di atas 5 rupiah per pageview, sampling layak dipertimbangkan. Mulai dengan rasio 50% dan turunkan bertahap sambil memantau stabilitas metrik p75. Bagi tim marketing yang belum punya akses dashboard RUM, ajak developer ngobrol soal apa yang sebenarnya bisa dipantau, sering kali rasio sampling dipilih asal tanpa input dari sisi pengukuran konversi.
Artikel Terkait
Digital Marketing
Cara Marketer Indonesia Pakai Baseline 2026 untuk Pilih Fitur Web Modern yang Aman Dipakai di Produksi
Berhenti menebak fitur web mana yang aman dipakai. Baseline 2026 dari WebDX memberi label resmi siap produksi. Panduan singkat dengan contoh keputusan.
Digital Marketing
Engagement Rate vs CTR: Mana yang Lebih Relevan untuk Marketer Indonesia 2026
Engagement Rate dan CTR sering disamakan padahal mengukur hal yang berbeda. Panduan praktis kapan pakai ER, kapan pakai CTR, dan kenapa pemilihan metrik salah bikin kampanye keliru.
Digital Marketing
Cara Marketer UMKM Indonesia Naikkan Email Deliverability di 2026
Open rate rendah sering bukan masalah konten, tapi deliverability. Panduan ringkas SPF, DKIM, DMARC, dan warm-up domain untuk marketer UMKM Indonesia di 2026.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang