Studi Kasus Vetmo: Optimasi Multimodal Search untuk Klinik Hewan Online 2026
TL;DR: Vetmo, klinik hewan online di Indonesia, menaikkan sitasi dari AI Search berbasis foto sebesar 1,8x dalam 75 hari dengan mengoptimasi konten untuk multimodal search. Kunci eksekusi: alt text deskriptif, structured data ImageObject, dan deskripsi gejala visual yang konsisten antara teks dan foto.
Saat seorang pemilik anjing melihat ruam aneh di kulit hewannya, dia jarang membuka Google dan mengetik nama penyakit. Dia memotret dan mengunggahnya ke ChatGPT atau Google Lens. Ini realitas baru yang mengubah cara bisnis jasa veteriner harus berpikir tentang SEO.
Vetmo menghadapi tantangan ini sejak awal 2026. Ketika audit awal kami lakukan, sebagian besar traffic AI mereka masih datang dari query teks, padahal konsultasi via foto adalah behavior dominan target market. Selisih ini jadi gap besar yang perlu ditutup.
Konteks Awal dan Hipotesis
Vetmo melayani konsultasi kesehatan hewan untuk pemilik di kota besar Indonesia. Kontennya kuat di sisi tekstual, tetapi lemah di sisi visual. Audit awal menunjukkan tiga gap utama: alt text generik, tidak ada structured data ImageObject, dan deskripsi gejala visual tidak konsisten antara halaman.
Hipotesisnya, kalau ketiga gap ditutup, AI multimodal akan lebih mudah memasangkan foto user dengan konten Vetmo. Pendekatan ini sejalan dengan konsep multimodal search optimization yang menjadi area fokus AI Search sejak akhir 2025.
Eksekusi 75 Hari
Pekerjaan dipecah jadi tiga fase, masing-masing 25 hari. Fokusnya satu lapisan per fase supaya hasil bisa diukur terpisah.
| Fase | Fokus | Output |
|---|---|---|
| 1 | Audit & alt text rewrite | 142 gambar dioptimasi |
| 2 | ImageObject schema | 38 halaman utama |
| 3 | Symptom description sync | Tabel gejala visual standar |
Fase pertama paling padat. Alt text lama berbentuk "anjing-ruam.jpg" diganti dengan deskripsi 80-120 karakter yang menyebut spesies, gejala, dan konteks klinis. Pendekatan ini diadaptasi dari panduan resmi web.dev tentang accessibility dan SEO gambar yang sekaligus jadi standar baseline.
Fase kedua memasang schema ImageObject di halaman layanan, termasuk properti contentUrl, caption, dan description. Fase ketiga menyusun tabel gejala visual yang konsisten dipakai di semua artikel, sehingga AI menemukan paralel antar konten dengan jelas.
Hasil dan Pola yang Muncul
Setelah 75 hari, tiga sinyal utama bergerak naik:
- Sitasi AI dari query visual naik dari 12 menjadi 22 referensi per bulan
- Klik dari Google AI Overview ke halaman layanan naik 1,8x
- Kontak via WhatsApp dari traffic AI bertambah konsisten
Yang menarik, halaman dengan structured data lengkap dikutip 3 kali lebih sering dibanding halaman tanpa schema. Pola ini juga muncul di proyek Nalesha (e-commerce parfum) dan Atmo LMS, walau di konteks berbeda. Konsistensinya menunjukkan structured data jadi pembeda saat AI menentukan sumber yang dikutip.
Pelajaran untuk Bisnis Jasa Lain
Multimodal search bukan tren yang relevan hanya untuk klinik hewan. Restoran, properti, fashion, dan otomotif semua menghadapi tantangan serupa. Tiga prinsip yang bisa diadaptasi dari kasus Vetmo:
Pertama, alt text adalah aset SEO, bukan sekadar accessibility. Investasi 1-2 menit per gambar bisa menentukan visibility di AI multimodal.
Kedua, structured data ImageObject masih jarang dipakai di Indonesia. Ini gap yang relatif murah untuk ditutup tetapi dampaknya signifikan. Untuk bisnis yang serius soal AEO, langkah ini perlu masuk ke checklist Schema Velocity Budget.
Ketiga, konsistensi deskripsi visual antar halaman membantu AI membangun konteks. Tabel gejala atau spesifikasi standar lebih kuat dibanding deskripsi bebas.
Pertanyaan Umum
Apakah multimodal search hanya untuk niche tertentu?
Tidak. Behavior search berbasis foto semakin umum di semua kategori, terutama produk visual dan layanan diagnostik.
Berapa lama hasil mulai terlihat?
Sinyal awal biasanya muncul di 30-45 hari, dampak signifikan di 75-90 hari. Variasinya tergantung kompetisi dan otoritas domain.
Apakah perlu tool khusus untuk audit multimodal?
Tidak wajib. Google Search Console dan audit manual sudah cukup untuk fase awal. Tool seperti Screaming Frog membantu skala lebih besar.
Schema mana yang paling penting?
ImageObject untuk halaman layanan. FAQPage untuk halaman pertanyaan umum. Keduanya saling menguatkan.
Insight Penutup
Vetmo adalah contoh bahwa optimasi multimodal search adalah pekerjaan rapi, bukan hack. Tiga lapisan dasar, alt text deskriptif, structured data, dan konsistensi konten, sudah cukup untuk membuka peluang signifikan. Bisnis jasa Indonesia yang masih fokus eksklusif ke query teks berisiko ketinggalan di kategori yang behaviornya bergeser ke visual.
Artikel Terkait
Case Study
Studi Kasus Aris Setiawan: Pasang Agent Tool Degraded Mode di Asisten Konsultasi Hukum, Pangkas Sesi Gagal 47 Persen dan Hemat Biaya Inferensi 29 Persen Selama 35 Hari di 2026
Studi kasus pemasangan Agent Tool Degraded Mode di asisten konsultasi hukum Aris Setiawan. Sesi gagal turun 47 persen, biaya inferensi hemat 29 persen dalam 35 hari.
Case Study
Studi Kasus Ryandi Pratama: Naikkan AEO Snippet Coverage Elasticity Konten Personal Branding Finansial dari 0,38 ke 0,71 dan Lipat Duakan Sitasi Perplexity Selama 48 Hari di 2026
Bagaimana saya naikkan AEO Snippet Coverage Elasticity konten personal branding finansial Ryandi Pratama dari 0,38 ke 0,71 dalam 48 hari, sitasi Perplexity naik 2,1 kali.
Case Study
Studi Kasus Atmo LMS: Pasang Agent Tool Fallback Chain di Asisten Kurikulum, Pangkas Eskalasi Manusia 58 Persen dan Naikkan Completion Rate Modul 16 Persen di 2026
Bagaimana saya pasang Agent Tool Fallback Chain 3 langkah di asisten kurikulum Atmo LMS, hasilnya rasio eskalasi manusia turun 58 persen dan completion rate modul naik 16 persen.
Butuh website yang benar-benar bekerja?
Hubungi Vito untuk konsultasi gratis 15 menit.
WhatsApp Sekarang