Digital Transformation
Golden Signals (Four Golden Signals)
Golden Signals adalah empat metrik inti SRE Google untuk memantau kesehatan layanan, yaitu latency, traffic, errors, dan saturation, yang menjadi dasar alerting dan SLO modern.
TL;DR: Golden Signals adalah empat metrik inti yang dikembangkan tim SRE Google untuk memantau kesehatan layanan production, yaitu latency, traffic, errors, dan saturation. Empat sinyal ini cukup untuk mendeteksi mayoritas insiden tanpa membanjiri tim dengan alert palsu.
Apa itu Golden Signals?
Golden Signals adalah kerangka monitoring yang diperkenalkan dalam buku Site Reliability Engineering Google. Konsepnya sederhana: alih-alih membuat ratusan grafik, fokus pada empat sinyal yang menjawab pertanyaan paling penting tentang sebuah layanan. Pendekatan ini menjadi fondasi praktik observability dan SLO di tim engineering modern.
Empat Sinyal
| Sinyal | Definisi | Contoh metrik |
|---|---|---|
| Latency | Waktu memproses permintaan | p50, p95, p99 response time |
| Traffic | Beban yang masuk ke sistem | Request per second, transactions per minute |
| Errors | Permintaan yang gagal | HTTP 5xx rate, exception count |
| Saturation | Seberapa penuh resource dipakai | CPU utilization, memory pressure, queue depth |
Kenapa Penting?
Tim engineering Indonesia sering memantau puluhan grafik tanpa tahu mana yang benar-benar relevan untuk SLA pengguna. Empat Golden Signals memberi prioritas yang jelas, terutama saat insiden terjadi dan waktu untuk menebak terbatas. Praktik ini cocok dipasangkan dengan chaos engineering untuk menguji apakah alert benar-benar memantulkan dampak ke pengguna. Sumber otoritatif: Google SRE Book, Bab Monitoring Distributed Systems.
Pertanyaan Umum
Apakah Golden Signals menggantikan RED dan USE?
Tidak menggantikan, tapi banyak overlap. RED (Rate, Errors, Duration) cocok untuk service request-driven, sementara USE (Utilization, Saturation, Errors) cocok untuk resource. Golden Signals menggabungkan keduanya.
Apakah cukup hanya 4 metrik untuk semua sistem?
Untuk layer aplikasi, 4 sinyal ini cukup sebagai baseline. Sistem yang punya kebutuhan khusus, misalnya queue worker atau batch processor, biasanya menambahkan metrik domain seperti queue lag.