
Salah satu inovasi model AI pembuat video yang dikembangkan Google telah menarik perhatian. Veo 3 mampu mengubah perintah teks (prompt) menjadi video berkualitas tinggi, lengkap dengan dialog, efek suara, dan musik.
Namun, di balik kecanggihan teknologi baru ini, muncul pertanyaan besar mengenai dampaknya terhadap masyarakat. Untuk memahami posisi Veo 3, penting juga untuk membandingkan dengan para pesaing seperti Sora, Runway, dan Pika Labs.
Google pun menjawab berbagai kekhawatiran. Belakangan Veo 3 dan versi yang lebih cepat, Veo 3 Fast, tersedia secara umum di platform Vertex AI milik Google Cloud. Versi ini dirancang untuk perusahaan yang ingin meningkatkan skala produksi video dengan efisien.
Fitur baru yang diperkenalkan telah bisa dilihat pratinjau-nya di Vertex AI pada bulan Agustus. Fitur ini memungkinkan pengguna untuk membuat klip video berdurasi delapan detik dari gambar statis atau AI-generated, hanya dengan memberikan deskripsi teks.
Untuk memudahkan pengguna, Veo 3 kini juga telah terintegrasi dengan beberapa layanan lain. Contohnya, Canva kini menggunakan teknologi Veo 3 untuk memungkinkan pengguna membuat video sinematik langsung di dalam platformnya.
Khusus untuk isu legal, Google Cloud menawarkan perlindungan hukum (legal indemnity) kepada pelanggan perusahaan yang menggunakan layanan AI generatif mereka, termasuk Veo 3, untuk mengurangi risiko yang berkaitan dengan hak cipta.
Keunggulan Veo 3
Veo 3 dianggap revolusioner karena mampu mendemokratisasi konten kreatif, memungkinkan siapa saja untuk menjadi kreator video. Individu atau tim kecil kini dapat menghasilkan konten berkualitas sinematik tanpa memerlukan kamera, kru, atau studio yang mahal.
Artikel di CNET menyoroti bahwa alat ini ideal untuk para “penggemar AI” yang ingin menjajal dunia pembuatan video. Selain itu, Veo 3 juga menawarkan efisiensi produksi yang luar biasa.
Untuk industri seperti pemasaran dan film, alat ini bisa menjadi “game-changer”, karena perusahaan dapat mempercepat pembuatan iklan dan materi promosi, seperti yang dilaporkan oleh The Times of India.
Keunggulan lain dari Veo 3 adalah kualitas dan realisme yang mengesankan. Veo 3 melampaui pendahulunya dan pesaingnya dengan kemampuan menghasilkan video hingga resolusi 4K, lengkap dengan fitur-fitur canggih seperti sinkronisasi audio, simulasi fisika yang realistis.
Selain itu, model terbaru ini memiliki pemahaman yang mendalam tentang perintah sinematik, seperti diulas di eWEEK. Dalam ulasang Tribunnews.com disebut Veo 3 dapat menghasilkan video, suara latar belakang, suara manusia yang dihasilkan oleh AI, dan membuatnya seperti nyata.
Yang Perlu Diwaspadai
Ancaman misinformasi dan deepfake adalah salah satu isu paling mendesak dari kemunculan Veo 3. Laporan dari TIME Magazine dan Al Jazeera menyoroti bagaimana kecanggihan Veo 3 dapat disalahgunakan untuk menciptakan video palsu (deepfake) yang sangat meyakinkan.
Video ini bisa digunakan untuk menyebarkan berita bohong tentang tokoh publik atau propaganda politik, yang berpotensi meruntuhkan batas antara fakta dan fiksi.
Selain itu, muncul pula kekhawatiran etika dan hak cipta. BeritaSatu.com melaporkan bahwa Google belum transparan mengenai sumber data yang digunakan untuk melatih Veo 3. Hal ini memicu spekulasi bahwa model dilatih menggunakan data publik dalam jumlah besar.
Kecurigaan juga menyasar video dari YouTube, yang digunakan tanpa izin atau kompensasi yang jelas dari para kreator. Kondisi ini memunculkan pertanyaan tentang kepemilikan konten baru yang dihasilkan dan bagaimana hak-hak kreator asli dilindungi.
Veo 3 juga memiliki keterbatasan, misalnya rendering yang lama dan durasi video yang terbatas. Selain itu, akses penuh ke Veo 3 saat ini sangat mahal, hanya tersedia untuk pelanggan premium ($249 per bulan), sehingga tidak semua orang dapat mencobanya.
Sebagai respons terhadap berbagai kekhawatiran ini, Google telah menyertakan watermark digital tak terlihat yang disebut SynthID pada setiap video buatan Veo 3.
SynthID adalah teknologi yang berfungsi sebagai “sidik jari digital” yang disematkan langsung ke dalam data piksel atau audio, memungkinkan platform digital mengidentifikasi video buatan AI.
Perbandingan dengan Layanan Lain
Memahami posisi Veo 3 di pasar memerlukan perbandingan dengan model AI video lainnya. Untuk memudahkan pencarian, kami tanyakan ke Google Gemini bagaimana perbandingan kinerja Veo 3 dibandingkan yang lain. Berikut jawabannya:
1. Veo 3 (Google)
- Fokus: Kualitas sinematik, realisme, dan kontrol yang presisi.
- Keunggulan: Resolusi 4K, audio bawaan, simulasi fisika realistis.
- Kelemahan: Akses terbatas, harga premium, dan waktu render yang lebih lama.
2. Sora (OpenAI)
- Fokus: Penceritaan yang kuat dan narasi yang kohesif.
- Keunggulan: Durasi video lebih panjang (hingga 60 detik), alur cerita yang logis, dan transisi mulus.
- Kelemahan: Tidak ada audio bawaan, resolusi maksimal 1080p, dan akses yang sangat terbatas.
3. Runway
- Fokus: Kreativitas, kecepatan, dan aksesibilitas.
- Keunggulan: Fitur kreatif canggih seperti Motion Brush, proses rendering yang lebih cepat, dan pilihan harga yang lebih fleksibel.
- Kelemahan: Hasilnya kadang terlihat lebih “stylized” atau kurang realistis, serta durasi video yang lebih pendek (sekitar 18 detik).
4. Pika Labs
- Fokus: Kecepatan, kemudahan penggunaan, dan konten media sosial.
- Keunggulan: Sangat ramah pengguna, cepat, dan ideal untuk membuat video pendek yang menarik.
- Kelemahan: Durasi video sangat pendek (3-6 detik), dan kualitas detail tidak setajam Veo 3.
Potensi Veo 3 untuk memberdayakan kreativitas sangat besar. Namun, tantangan etika dan risiko misinformasi yang menyertainya tidak bisa diabaikan. Teknologi ini, bersama dengan Sora, Runway, dan Pika, akan terus berkembang.
Masa depan teknologi ini akan sangat bergantung pada bagaimana semua pihak – dari pengembang hingga pengguna – dapat bekerja sama untuk memanfaatkan kekuatannya sambil mengelola risiko yang ada.
*Photo by Chris Zhang via Unsplash
Komentar Anda?