
Sejak melancarkan Gemini, Google telah memberi tumpuan terutamanya kepada menambah penjanaan imej dan pelbagai integrasi model. Sekarang, Google memperluaskan keupayaan penjanaan video dengan membawa penjana VEO 2 kepada lebih banyak pengguna melalui AI Chatbot.
VEO 2 diumumkan pada bulan Disember tahun lepas, menjanjikan realisme yang dipertingkatkan dalam penjanaan video melalui penambahan fizik dunia dan pergerakan manusia yang lebih baik, serta butiran yang lebih baik berbanding dengan model terdahulu. Google kini telah mengumumkan bahawa ia melancarkan penjana video ke Gemini, menjadikannya tersedia untuk pengguna Gemini Advanced dengan langganan Premium Google One AI di kedua -dua platform mudah alih dan web.
Dengan VEO 2 yang disatukan ke Gemini, pengguna boleh menjana video menggunakan arahan teks mudah. Walau bagaimanapun, Syarikat menekankan bahawa lebih terperinci perihalan yang diberikan dalam setiap prompt, semakin tepat video yang dihasilkan. Ciri ini menyokong pelbagai gaya dan genre filem, termasuk kesan sinematik dan kanta.
Cara menjana video di Gemini
Untuk menghasilkan video, pengguna perlu memilih model VEO 2 dari menu pemilihan model AI sebelum memasukkan teks teks mereka. Google mencatatkan bahawa lokasi pemilihan model ini mungkin berubah pada masa akan datang. Di samping itu, bilangan video yang boleh dihasilkan oleh pengguna adalah terhad setiap bulan, walaupun Google belum menetapkan kuota bulanan yang tepat.
Setiap video akan menjadi 8 saat panjang dan dalam resolusi 720p dengan nisbah aspek 16: 9, yang berbeza dari Openai’s Sora, yang dapat menghasilkan video 1080p sehingga 20 saat. Video akan dihasilkan dalam format fail MP4, yang pengguna boleh menyimpan. Pada peranti mudah alih, akan ada alat untuk memuat naik dan berkongsi video yang dihasilkan dengan mudah ke platform media sosial seperti YouTube dan Tiktok.
Google juga menyatakan bahawa video yang dihasilkan oleh Veo menggunakan watermark digital synthid, sama dengan tanda air yang digunakan dalam imej yang dihasilkan oleh Gemini atau model Imagen.
Google juga memperluaskan fungsi Veo ke ciri eksperimennya, Whisk. Aplikasi Generator Imej AI ini membolehkan pengguna membuat imej menggunakan kedua -dua teks dan input imej, dan sekarang, dengan integrasi VEO 2, pengguna boleh menghidupkan imej yang dibuat dalam Whisk. Video animasi ini juga akan menjadi 8 saat panjang dan dalam format MP4 yang sama seperti video yang dihasilkan secara langsung dalam Gemini.
Model VEO 2 kini melancarkan ke Gemini Advanced dan boleh didapati dalam bahasa Inggeris. Ia mungkin mengambil masa sehari sebelum model muncul untuk semua pelanggan.
Adakah anda telah bereksperimen dengan aplikasi penjana video AI? Penjana mana yang anda sukai? Kongsi pengalaman anda dalam komen di bawah.
Sumber:
Google