Digital Transformation

Data Contract (Kontrak Data Antar Tim)

Data Contract adalah kesepakatan tertulis antara penghasil dan pemakai data yang menetapkan skema, semantik, kualitas, dan SLA, sehingga perubahan upstream tidak mendadak merusak dashboard atau model.

Vito Atmo
Vito Atmo·13 Mei 2026·0 kali dibaca·2 min baca

TL;DR: Data Contract adalah perjanjian eksplisit antara tim yang memproduksi data dan tim yang mengkonsumsinya. Kontrak ini menjelaskan struktur, makna, frekuensi update, dan jaminan kualitas tiap field. Di perusahaan Indonesia yang berbagi data antara tim engineering, marketing, dan analytics, Data Contract memperkecil insiden dashboard rusak akibat skema berubah diam-diam.

Apa itu Data Contract?

Data Contract memformalkan ekspektasi antar tim soal data. Mirip API contract di rekayasa software, Data Contract memuat skema, tipe data, definisi metric, frekuensi, owner, dan prosedur perubahan. Konsep ini menjadi pilar penting governance data modern dan saling melengkapi dengan praktik evals untuk pipeline AI.

Komponen Umum

KomponenIsi
SchemaNama field, tipe, nullability
SemantikDefinisi metric, satuan, agregasi
SLAFrekuensi update, latency maksimum
Quality rulesValidasi, threshold null, uniqueness
OwnerTim atau individu penanggung jawab
Change policyVersi, deprecation, notifikasi

Kenapa Penting?

Dalam praktik di tim analytics Indonesia, sekitar 30-50 persen insiden dashboard rusak berakar dari perubahan upstream yang tidak diumumkan. Data Contract mengubah komunikasi ad-hoc menjadi kontrak yang dapat diuji otomatis di CI. Hasilnya, perubahan upstream wajib bumping versi, dan dashboard maupun model marketing tidak meledak diam-diam di hari rilis kampanye.

Pertanyaan Umum

Apakah Data Contract membuat tim lebih lambat?

Awalnya iya, karena perlu menulis dokumen dan memasang validasi. Setelah berjalan, recovery time saat ada perubahan justru jauh lebih cepat karena perubahan tidak dibuat diam-diam.

Tool apa yang umum dipakai?

Beberapa tim memakai dbt contracts, Great Expectations, atau JSON Schema khusus di repo data platform. Pilihan tergantung stack analytics yang dipakai.

Bagikan