Digital Transformation

Tail Latency (p95, p99)

Latensi yang dialami pengguna di sisi paling lambat distribusi performa, biasanya diukur sebagai persentil ke-95 dan ke-99 dari waktu respons.

Vito Atmo
Vito Atmo·28 April 2026·0 kali dibaca·3 min baca

TL;DR: Tail latency adalah latensi yang dialami pengguna di ujung distribusi performa, paling sering diukur dengan persentil p95 dan p99. Angka rata-rata sering menyembunyikan masalah, sedangkan p95 dan p99 mengungkap pengalaman pengguna paling lambat. Memantaunya menjadi praktik wajib bagi tim website bisnis yang serius soal Core Web Vitals dan keandalan.

Apa itu Tail Latency?

Tail latency mengacu pada bagian distribusi waktu respons yang berada di ujung lambat. Persentil p95 berarti 95 persen permintaan selesai di bawah angka tersebut, sisanya 5 persen lebih lambat. Persentil p99 lebih ketat, menyisakan 1 persen pengalaman terlambat. Konsep ini populer di engineering performa berkat publikasi Jeff Dean dari Google pada 2013 berjudul "The Tail at Scale".

Berbeda dari rata-rata yang dapat tertarik oleh sebagian besar permintaan cepat, tail latency menyoroti pengalaman pengguna yang sebenarnya paling buruk. Untuk konteks web modern, p75 sering menjadi titik referensi Core Web Vitals sedangkan p95 dan p99 dipakai untuk SLA backend dan analisa INP yang ekstrem.

Cara Membaca Persentil

MetrikArtiKapan dipakai
Average (mean)Rata-rata semua permintaanRingkasan kasar, mudah menyesatkan
p50 (median)50 persen permintaan di bawah angka iniPengalaman tipikal
p7575 persen permintaan lebih cepatTolok ukur Core Web Vitals
p9595 persen permintaan lebih cepatPengalaman pengguna sisi lambat
p9999 persen permintaan lebih cepatSLA backend, deteksi outlier

Untuk audit performa, baca p75 dan p95 berdampingan. Jika p75 baik tetapi p95 buruk, masalah hanya menimpa sebagian kecil pengguna, biasanya karena perangkat low-end, jaringan lemah, atau antrian server saat puncak trafik.

Kenapa Penting?

Untuk website bisnis Indonesia, tail latency menjadi alarm dini. Ketika p99 melonjak, biasanya satu segmen pengguna mengalami halaman lambat parah, lalu meninggalkan situs sebelum konversi. Memantau p95 dan p99 dengan data RUM memungkinkan tim memprioritaskan optimasi pada area yang paling menyakitkan secara bisnis, bukan hanya pada rata-rata yang terlihat aman.

Pertanyaan Umum

Apakah p99 selalu lebih penting daripada p50?

Tidak otomatis. p50 menggambarkan pengalaman mayoritas, p99 menggambarkan kasus terburuk. Keduanya saling melengkapi dan keputusan optimasi sebaiknya didasarkan pada keduanya, bukan salah satu.

Berapa selisih sehat antara p50 dan p95?

Idealnya p95 tidak lebih dari dua sampai tiga kali p50. Selisih lebih besar dari itu menandakan distribusi performa tidak stabil dan ada outlier yang perlu diinvestigasi.

Bagikan