Feature Store: Cara Tim Engineering Indonesia Bawa Model ML ke Produksi Tanpa Drift
TL;DR: Feature store adalah lapisan data terpusat yang menyajikan fitur ML konsisten antara saat training dan serving. Tanpa ini, tim sering rilis model yang akurasinya turun di produksi karena fitur dihitung beda di notebook vs API. Untuk tim Indonesia yang baru bawa model rekomendasi atau scoring ke produksi, feature store memutus drift dan mempercepat eksperimen tanpa harus duplikasi pipeline.
Saat membantu sebuah marketplace di Indonesia menerapkan model lead scoring, kami menemukan masalah klasik: angka conversion probability di notebook 0,82, tapi di endpoint produksi hanya 0,61 untuk pengguna yang sama. Penyebabnya bukan model rusak. Penyebabnya: feature "30-day spend" dihitung dari Snowflake saat training, tapi dari Redis cache yang lag 8 jam saat serving.
Bug seperti ini wajar terjadi di tim yang scale ML lebih cepat daripada infrastrukturnya. Solusinya bukan training ulang, tapi memperkenalkan feature store sebagai single source of truth.
Masalah Sebenarnya: Training-Serving Skew
Skew muncul saat fitur yang sama dihitung dengan logika atau sumber berbeda di dua jalur (training pipeline vs inference API). Hasilnya: model yang valid secara statistik gagal di produksi. Riset Uber Engineering pada 2024 menyebut training-serving skew sebagai akar masalah nomor satu di kegagalan deployment ML.
Untuk produk dengan reasoning model atau klasifikasi real-time, skew membuat metrik bisnis ikut bias. Marketing yang mengandalkan score ini untuk targeting akan salah alokasi budget tanpa sadar.
Anatomi Feature Store
| Komponen | Fungsi | Tools umum |
|---|---|---|
| Offline store | Simpan fitur historis untuk training | BigQuery, Snowflake, Iceberg |
| Online store | Serving fitur real-time low-latency | Redis, DynamoDB, Bigtable |
| Registry | Definisi fitur (nama, owner, schema) | Feast, Tecton, Hopsworks |
| Materialization job | Sinkron offline ke online berkala | Airflow, dbt, Spark |
| Monitoring | Deteksi feature drift dan staleness | WhyLabs, Evidently |
Fitur didefinisikan sekali di registry, lalu dipanggil dengan satu API entah saat training atau saat inference. Konsistensi otomatis terjaga karena hanya ada satu definisi yang dieksekusi di kedua jalur.
Studi Kasus Implementasi
Untuk marketplace tadi, kami memakai Feast (open source) di atas BigQuery + Redis. Empat fitur utama (30-day spend, last-7-day session count, primary device, days since signup) dipindah ke registry. Hasil setelah dua sprint:
- Akurasi produksi naik dari 0,61 ke 0,79 (gap dengan training tinggal 3 poin)
- Time-to-experiment turun dari rata-rata 5 hari ke 1 hari karena tim data tidak menulis ulang SQL pipeline
- Insiden "model output aneh" turun dari 4-6 per bulan ke 0-1
Lihat juga praktik LLM grounding untuk konteks bagaimana data konsisten juga jadi fondasi fitur AI generatif. Untuk evaluasi model yang masuk ke feature store, model evaluation dan agent evaluation tetap wajib dijalankan terpisah sebelum pipeline materialization aktif.
Build vs Buy untuk Tim Indonesia
Tidak semua tim butuh Tecton atau Hopsworks dari hari pertama. Heuristik praktis:
- 0-3 model di produksi: cukup BigQuery + Redis manual + tabel definisi fitur internal di Notion
- 3-10 model: pertimbangkan Feast (open source, gratis lisensi, butuh effort ops)
- 10+ model atau tim ML 10+ orang: managed service (Tecton, Vertex AI Feature Store) sering lebih murah daripada salary engineer ops
Untuk konteks praktis, lihat juga composable architecture sebagai pola umum agar feature store tidak terkunci pada satu vendor.
Pertanyaan Umum
Apakah feature store hanya untuk model ML klasik?
Tidak. Konsep yang sama berlaku untuk embedding dan retrieval di sistem RAG. Embeddings dianggap fitur juga, jadi banyak tim mulai menyimpan vector di feature store yang sama.
Apa beda feature store dengan data warehouse biasa?
Data warehouse fokus analitik historis, latency tinggi tidak masalah. Feature store wajib serve fitur real-time (millisecond), sambil tetap menyimpan historis untuk training. Dua kebutuhan ini biasanya dipisah jadi offline + online store.
Berapa lama implementasi feature store?
Untuk tim 3-5 engineer dengan stack standar, MVP Feast biasanya 4-8 minggu. Adopsi penuh (semua model migrasi ke registry) sering butuh 2-3 kuartal.
Apakah Supabase atau Postgres bisa jadi online store?
Bisa untuk traffic rendah hingga menengah. Untuk traffic tinggi atau latency budget di bawah 50 ms, Redis atau DynamoDB lebih aman. Lihat panduan latency budget untuk konteks angka.
Penutup
Feature store bukan sekadar trend infra ML. Ia adalah jawaban arsitektural untuk masalah bisnis nyata: model yang disetujui di review tapi gagal di produksi. Bagi tim engineering Indonesia yang sedang scale dari 1 model ke banyak model, investasi ini biasanya bayar balik di kuartal pertama lewat penurunan insiden dan kecepatan eksperimen. Mulai dari yang kecil (registry sederhana di repo), lalu tumbuhkan saat jumlah model bertambah. Referensi resmi: Feast documentation dan Google ML Ops guide.
Artikel Terkait
Digital Marketing
Engagement Rate vs CTR: Mana yang Lebih Relevan untuk Marketer Indonesia 2026
Engagement Rate dan CTR sering disamakan padahal mengukur hal yang berbeda. Panduan praktis kapan pakai ER, kapan pakai CTR, dan kenapa pemilihan metrik salah bikin kampanye keliru.
Digital Marketing
Cara Marketer UMKM Indonesia Naikkan Email Deliverability di 2026
Open rate rendah sering bukan masalah konten, tapi deliverability. Panduan ringkas SPF, DKIM, DMARC, dan warm-up domain untuk marketer UMKM Indonesia di 2026.
Digital Marketing
Cara Marketer Indonesia Pasang Event Tracking GA4 Tanpa Tim Developer 2026
Event tracking GA4 sering dianggap milik developer. Padahal marketer Indonesia bisa pasang event penting sendiri lewat Google Tag Manager dalam 60 menit.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang