Digital Transformation

Embeddings

Embeddings adalah representasi numerik (vektor) dari teks, gambar, atau objek lain yang menangkap makna semantiknya, dipakai sebagai fondasi pencarian semantik dan sistem AI modern.

Vito Atmo
Vito Atmo·26 April 2026·0 kali dibaca·2 min baca

TL;DR: Embeddings adalah cara mengubah teks atau objek menjadi deretan angka (vektor) yang menangkap makna semantiknya. Dua teks dengan makna mirip menghasilkan vektor yang berdekatan, sehingga komputer bisa mencari berdasarkan makna, bukan pencocokan kata.

Apa itu Embeddings?

Embeddings adalah jembatan antara bahasa manusia dan bahasa matematika yang dipahami mesin. Bayangkan setiap kalimat ditempatkan di peta multidimensi: kalimat "harga jasa pembuatan website" dan "biaya bikin web" akan jatuh berdekatan, sementara "resep rendang" jauh terpisah, walaupun ketiganya sama-sama berbahasa Indonesia.

Embeddings dihasilkan oleh model khusus seperti OpenAI text-embedding-3 atau Cohere Embed v3. Output umumnya berupa vektor 768 hingga 3072 dimensi yang disimpan di vector database untuk pencarian cepat. Embeddings menjadi fondasi Retrieval Augmented Generation dan banyak fitur AI berbasis konteks.

Cara Kerja Singkat

TahapYang terjadi
1. InputKalimat, paragraf, atau gambar masuk ke model embedding
2. EncodingModel mengubah input menjadi vektor angka
3. StorageVektor disimpan dengan metadata di vector store
4. QueryPertanyaan diubah jadi vektor, lalu dibandingkan kemiripannya
5. HasilTop-K item paling mirip dikembalikan

Kenapa Penting?

Untuk marketer dan developer Indonesia, embeddings membuka tiga peluang konkret. Pertama, search internal yang paham sinonim, sehingga "dokter kandungan" dan "obgyn" dianggap sama. Kedua, klasifikasi otomatis konten masuk ke kategori yang tepat tanpa rule manual. Ketiga, rekomendasi konten berbasis kemiripan makna, bukan tag yang dipasang manual. Embeddings juga jadi prasyarat untuk membangun chatbot yang menjawab dari knowledge base brand.

Pertanyaan Umum

Apakah embeddings sama dengan tokenisasi?

Tidak. Tokenisasi memecah teks jadi unit kecil (token). Embeddings mengubah token atau urutan token menjadi vektor numerik bermakna. Tokenisasi adalah persiapan, embeddings adalah representasi.

Berapa biaya embeddings untuk skala kecil?

Untuk model komersial seperti OpenAI text-embedding-3-small, biaya per 1 juta token rata-rata di kisaran 0,02 dolar AS. Untuk konten 1000 artikel rata-rata 1500 kata, biaya satu kali embedding biasanya di bawah 1 dolar AS.

Bagikan