Digital Transformation
Feature Store
Feature Store adalah sistem terpusat yang menyimpan, mengelola, dan menyajikan fitur (variabel) machine learning yang siap pakai untuk training maupun inferensi real-time.
TL;DR: Feature Store adalah lapisan data yang menstandarkan fitur machine learning agar konsisten antara saat training model dan saat inferensi di produksi. Tanpa Feature Store, tim sering menemukan model yang akurat di lab tapi melenceng di produksi karena perbedaan logika perhitungan fitur. Feature Store mengeliminasi training-serving skew dan mempercepat eksperimen tim data dan engineering.
Apa itu Feature Store?
Dalam pipeline machine learning, fitur adalah variabel input yang sudah dirapikan, misalnya rata-rata transaksi 30 hari terakhir atau jumlah klik dalam 24 jam. Feature Store adalah platform yang menyimpan fitur ini di dua tempat sekaligus, online store untuk akses cepat saat inferensi, dan offline store untuk training. Dengan satu definisi fitur yang dipakai bersama, tim tidak perlu menulis ulang query SQL setiap kali butuh fitur yang sama. Konsep ini dipopulerkan oleh Uber lewat Michelangelo, lalu diadopsi luas via tools seperti Feast, Tecton, dan Vertex AI Feature Store.
Komponen Utama
| Komponen | Fungsi |
|---|---|
| Offline Store | Menyimpan historis fitur (Parquet, BigQuery) untuk training batch |
| Online Store | Database low-latency (Redis, DynamoDB) untuk inferensi real-time |
| Feature Registry | Katalog metadata, owner, deskripsi setiap fitur |
| Transformation Engine | Definisi logika perhitungan fitur, sering pakai SQL atau Python |
Kenapa Penting
Untuk produk yang mengandalkan rekomendasi, scoring kredit, atau personalisasi, training-serving skew adalah penyebab utama model anjlok di produksi. Feature Store menutup celah itu dengan satu sumber kebenaran. Bagi tim Indonesia yang mulai serius dengan ML produk, Feature Store memungkinkan kolaborasi antara data scientist dan engineer tanpa drama, mirip peran [Vector Embedding](/glosarium/vector-embedding) di sistem RAG. Untuk pemahaman lebih dalam, lihat tulisan rujukan di Feature Store overview oleh Tecton.
Pertanyaan Umum
Apakah semua tim ML butuh Feature Store?
Tidak. Tim kecil dengan sedikit model dan tanpa kebutuhan inferensi real-time bisa hidup dengan notebook dan SQL view. Feature Store mulai berharga ketika ada banyak model berbagi fitur yang sama dan butuh konsistensi.
Apa beda Feature Store dengan Data Warehouse?
Data Warehouse fokus pada analytics dan reporting historis. Feature Store fokus pada penyajian fitur dengan kontrak SLA latency rendah untuk inferensi, plus reproducibility untuk training.
Istilah Terkait