Multimodal Search untuk E-commerce Indonesia: Cara Produk Anda Ditemukan Tanpa Nama Brand
Multimodal search mengubah cara konsumen menemukan produk lewat foto, screenshot, atau video. Pelajari strategi praktis agar toko Anda muncul di Google Lens dan AI Search.
TL;DR: Multimodal search membuat konsumen bisa mencari produk lewat foto plus teks, bukan kata kunci saja. Per April 2026, Google Lens menangani lebih dari 20 miliar pencarian visual per bulan menurut data publik Google. E-commerce yang ingin tetap relevan perlu memperkuat alt text, structured data Product, dan deskripsi visual halaman, tidak cukup hanya optimasi keyword tradisional.
Saya pernah ngobrol dengan founder UMKM parfum yang heran produknya tidak muncul saat calon pembeli memotret botolnya di Google Lens. Padahal produk fisiknya unik, kemasan kayu, label tulisan tangan. Setelah audit, masalahnya jelas: foto produk di websitenya bernama IMG_2391.jpg, tanpa alt text, tanpa schema. Multimodal search butuh lebih dari sekadar gambar bagus.
Konteks 2026 berubah cepat. Generasi pembeli baru terbiasa screenshot, lalu lingkari objek lewat Circle to Search, lalu tanyakan "yang lebih murah dari ini". Mesin pencari menjawab pertanyaan visual itu dengan menggabungkan banyak sinyal, bukan hanya teks alt.
Apa yang Dibaca Mesin Multimodal
Mesin pencari multimodal seperti Google Lens dan ChatGPT vision mengandalkan beberapa lapis data untuk memahami sebuah produk. Lapisan pertama adalah pixel gambar itu sendiri. Lapisan kedua adalah konteks halaman tempat gambar berada. Lapisan ketiga adalah structured data yang menjelaskan entitas produk secara eksplisit.
Praktik yang saya pakai di proyek e-commerce: setiap gambar produk wajib punya nama file deskriptif (parfum-kayu-nalesha-50ml.webp), alt text yang menjelaskan visual plus identitas (Botol parfum kemasan kayu Nalesha varian Kasturi 50ml), dan halaman induk yang punya minimal 300 kata deskripsi. Dokumentasi resmi Google Search Central di panduan SEO untuk gambar menegaskan tiga sinyal ini sejak update besar mereka di 2024.
Kerangka Optimasi 4 Lapis
| Lapis | Aksi konkret | Dampak |
|---|---|---|
| File asset | Nama file SEO friendly, format webp/avif, ukuran wajar | Crawl efficient |
| Alt & caption | Alt text faktual 100-160 char, caption naratif | Aksesibilitas + relevansi |
| Schema | Product, ImageObject, Offer, AggregateRating | Eligible rich result |
| Halaman induk | Heading jelas, deskripsi lengkap, FAQ, internal link | Konteks teks |
Kerangka ini lengkap, tetapi yang sering luput adalah halaman induk. Tanpa konten teks yang kuat, schema dan alt text kehilangan jangkar.
Studi Kasus: Audit Cepat Toko Online
Saat membantu Nalesha (e-commerce parfum) menyiapkan toko mereka untuk era multimodal, langkah pertama adalah audit 12 produk teratas. Temuannya: 9 dari 12 produk punya nama file generik, 11 dari 12 tidak punya schema Product, dan deskripsi rata-rata cuma 80 kata. Setelah perbaikan dalam 3 minggu, gambar produk mulai muncul di hasil Google Lens untuk pencarian visual seperti "parfum botol kayu" dan "parfum unisex Indonesia". Klik organik ke product detail page naik dalam range 25-40 persen dibanding bulan sebelumnya, mengikuti pola yang juga dilaporkan studi industri seperti riset Search Engine Land soal visual search terkait dampak Google Lens.
Pelajaran kuncinya bukan teknologinya, melainkan disiplin: setiap produk diperlakukan seperti halaman SEO mandiri, lengkap dengan struktur dan konteks yang konsisten. Penjelasan rinci soal pemilihan istilah dapat dibaca di Multimodal Search, [schema markup praktis](/artikel/schema-markup-praktis-5-tipe-wajib), dan kombinasinya dengan people also ask yang memperkaya konteks.
Pertanyaan Umum
Apakah multimodal search akan mengganti SEO teks?
Tidak. Multimodal memperluas, bukan menggantikan. Konten teks tetap menjadi jangkar konteks bagi gambar dan video di halaman yang sama.
Format gambar mana yang paling baik untuk multimodal?
WebP dan AVIF lebih ringan dengan kualitas setara JPG/PNG. Mesin pencari mendukung keduanya dan halaman lebih cepat, sehingga skor Core Web Vitals ikut membaik.
Apakah produk lokal punya peluang muncul di Google Lens?
Punya, asalkan halaman produk lengkap secara teknis. Saya melihat produk UMKM Indonesia muncul di hasil visual untuk query niche, terutama yang punya struktur halaman jelas dan structured data yang valid.
Penutup Aplikatif
Mulai dari audit gambar 10-20 produk paling sering dicari, perbaiki nama file, alt text, dan schema di sprint pertama. Tunggu 4-6 minggu, lalu evaluasi. Multimodal search bukan tren sesaat, tapi cara baru pembeli menemukan toko Anda tanpa pernah mengetik nama brand.
Artikel Terkait
Website Bisnis
Headless CMS untuk Marketer Indonesia: Kapan Worth Dipakai dan Kapan Cuma Bikin Repot
Headless CMS dijual sebagai masa depan konten. Tapi untuk banyak tim marketing Indonesia, ia justru menambah ketergantungan ke developer tanpa hasil yang sepadan.
Website Bisnis
Latency Budget: Cara Marketer dan Developer Indonesia Sepakat Soal Kecepatan Website
Latency budget adalah cara paling jujur menyatukan tim marketing dan developer di sekitar target performa. Anggaran eksplisit per tahap memaksa keputusan, bukan kompromi diam.
Website Bisnis
Cara Mengukur ROI Website Bisnis dalam 90 Hari Pertama
Banyak pebisnis Indonesia bingung mengukur dampak website baru. Kerangka 90 hari ini fokus pada metrik leading dan lagging yang realistis untuk diukur sejak hari pertama.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang