RUM Sampling Strategy: Cara Marketer Indonesia Membaca Web Vitals dari Pengguna Asli Tanpa Boros Budget
Sampling Real User Monitoring memungkinkan marketer membaca Web Vitals akurat tanpa membayar penuh per pageview. Pelajari rasio dan trade-off-nya.
TL;DR: Real User Monitoring atau RUM mengukur Web Vitals dari pengguna asli, namun mengirim setiap event ke server analytics bisa mahal di skala jutaan pageview. Sampling rate 10-20% biasanya cukup untuk mendapat sinyal stabil pada metrik p75 yang dipakai Google, asalkan distribusinya seragam dan halaman ekor panjang tidak under-sampled.
Saat membantu salah satu e-commerce klien dengan traffic 3 juta pageview per bulan, biaya RUM dari vendor enterprise hampir mencapai 9 juta rupiah per bulan saat semua event dikirim. Setelah pindah ke sampling 10% dengan stratification per template halaman, biaya turun ke 1,2 juta dan akurasi metrik p75 tetap di kisaran toleransi 3%. Keputusan sampling memengaruhi kualitas data dan biaya, dan sering kali tim marketing tidak diajak bicara saat developer memilih rasio.
Artikel ini menjelaskan cara memilih rasio sampling yang masuk akal untuk website bisnis Indonesia, dan apa yang harus dijaga supaya data tetap representatif.
Kenapa Sampling Penting
Real User Monitoring mengirim event Web Vitals dari browser pengguna ke server analytics setiap pageview. Pada skala kecil (di bawah 100.000 pageview per bulan), biaya tidak menjadi isu. Mulai dari 1 juta pageview, vendor RUM seperti New Relic, Datadog, atau Vercel Speed Insights menagih per event yang masuk.
Sampling adalah praktik mengirim hanya sebagian event ke server, lalu mengekstrapolasi statistik untuk seluruh populasi. Ini bukan trade-off antara akurasi dan biaya semata, tetapi keputusan rekayasa data yang punya aturan main.
Aturan dasar yang saya pakai:
| Volume bulanan | Rasio sampling rekomendasi | Alasan |
|---|---|---|
| < 500.000 pageview | 100% | Biaya masih wajar, data lengkap berguna untuk debugging |
| 500.000 - 2 juta | 25-50% | Mulai berbiaya signifikan, p75 stabil dengan sampel ini |
| 2-10 juta | 10-20% | Sampel masih cukup untuk metrik p75, cost saving signifikan |
| > 10 juta | 5-10% | Statistik tetap stabil pada metrik p75 dan p95 |
Angka di atas berdasarkan benchmark di tiga proyek client Indonesia, dengan margin of error toleransi 3% untuk metrik p75 LCP dan INP.
Jangan Sampling Acak Murni
Sampling acak sederhana (random uniform) bermasalah saat distribusi traffic tidak seragam. Misalnya, halaman beranda mendapat 60% traffic, halaman produk 30%, halaman blog 10%. Sampling acak 10% akan menghasilkan 6.000 sampel beranda, 3.000 produk, dan hanya 1.000 blog dari 100.000 pageview. Margin of error untuk halaman blog menjadi besar.
Solusinya adalah stratified sampling: tetapkan rasio berbeda per kategori halaman. Misalnya 5% untuk beranda, 10% untuk produk, 50% untuk blog. Hasilnya 3.000 sampel per kategori, distribusi data lebih sehat.
Dokumentasi web.dev tentang web-vitals library memuat contoh implementasi stratified sampling lewat custom logic di reporter function.
Yang Harus Dijaga Marketer
Beberapa praktik yang sering terlewat:
- Konsistensi sampling per pengguna, bukan per pageview. Jika user yang sama dipantau penuh dalam satu sesi, journey mapping lewat GA4 atau session replay tetap utuh. Sampling per pageview memutus continuity.
- Boost sampling untuk traffic kampanye, terutama saat A/B test berjalan. Halaman variant biasanya volume kecil, sampling rendah membuat hasil sulit diuji secara statistik.
- Tidak men-sampling event error. Error JavaScript dan Web Vitals failure (misalnya LCP di atas 4 detik) harus selalu dikirim 100%, karena kasus ekstrim adalah yang paling perlu dipantau.
- Catat rasio sampling di event payload. Tanpa metadata ini, tim data tidak bisa mengekstrapolasi total dengan benar saat membaca dashboard.
Studi Kasus: Optimasi Budget RUM Vetmo
Saat Vetmo tumbuh ke 4 juta pageview per bulan, biaya Datadog RUM melonjak ke kisaran 7-8 juta rupiah per bulan. Setelah audit, kami menerapkan stratified sampling 15% rata-rata dengan boost 50% di halaman checkout dan 100% pada event error.
Setelah 30 hari, biaya turun 78% sementara metrik p75 LCP yang dilaporkan ke tim marketing tetap di kisaran 1% margin of error vs data full sampling baseline. Tim marketing bisa terus memantau Core Web Vitals per kategori produk tanpa perlu menyetujui kenaikan budget.
Pelajaran utama: sampling bukan kompromi data, melainkan rekayasa yang memerlukan kolaborasi marketing-developer. Marketer harus menyebut metrik mana yang mission-critical, developer menentukan rasio yang menjamin akurasi metrik tersebut.
Pertanyaan Umum
Apakah sampling memengaruhi data Chrome UX Report?
Tidak. Chrome UX Report adalah dataset terpisah yang dikumpulkan Google langsung dari pengguna Chrome opt-in. Sampling RUM Anda tidak memengaruhi CrUX, dan keduanya bisa dipakai berdampingan.
Berapa minimum sampel untuk metrik p75 yang reliable?
Statistik p75 dengan margin error 3% biasanya membutuhkan minimal 1.000-2.000 sampel per kategori per minggu. Jika di bawah itu, naikkan rasio sampling untuk kategori tersebut.
Apakah Vercel Speed Insights mendukung sampling?
Vercel Speed Insights default mengambil sample berdasarkan tier paket. Untuk kontrol granular, gunakan library web-vitals Google dan kirim ke endpoint kustom dengan logic sampling sendiri.
Bagaimana sampling memengaruhi A/B test yang mengukur Web Vitals?
Sampling rate harus sama di semua variant test. Jika tidak, perbedaan jumlah sampel bisa disalahartikan sebagai perbedaan performa.
Apakah ada open source alternatif untuk RUM dengan sampling?
Ya, web-vitals library Google dapat dipasangkan dengan endpoint kustom (misalnya Cloudflare Workers atau Edge Functions Vercel) untuk RUM tanpa biaya vendor. Logic sampling diatur di reporter function.
Apa yang Bisa Dimulai Minggu Ini
Audit invoice RUM bulan terakhir dan hitung biaya per pageview. Jika di atas 5 rupiah per pageview, sampling layak dipertimbangkan. Mulai dengan rasio 50% dan turunkan bertahap sambil memantau stabilitas metrik p75. Bagi tim marketing yang belum punya akses dashboard RUM, ajak developer ngobrol soal apa yang sebenarnya bisa dipantau, sering kali rasio sampling dipilih asal tanpa input dari sisi pengukuran konversi.
Artikel Terkait
Digital Marketing
Multi-Touch Attribution untuk Marketer Indonesia: Cara Atur Budget Iklan di Era Cookieless 2026
Cookie pihak ketiga sudah pensiun, last-click bohong, dan dashboard Meta Ads klaim semua konversi sebagai miliknya. Begini cara marketer Indonesia memakai MTA tanpa terjebak laporan yang salah arah di 2026.
Digital Marketing
Shadow IT di Perusahaan Indonesia: Cara Memetakan Tool AI Karyawan Sebelum Jadi Risiko Kepatuhan 2026
Karyawan pakai ChatGPT pribadi, tim marketing langganan SaaS sendiri, akuntan unggah laporan ke tool AI gratisan. Begini cara perusahaan Indonesia menata Shadow IT tanpa membunuh kecepatan tim di 2026.
Digital Marketing
Churn Prediction untuk SaaS Indonesia: Cara Customer Success Bertindak Sebelum Pelanggan Diam-diam Pergi 2026
Pelanggan SaaS jarang mengeluh sebelum pergi. Mereka berhenti login, berhenti bayar, lalu hilang. Churn prediction mengubah customer success dari reaktif menjadi proaktif sebelum revenue keluar pintu.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang