Google telah memperluaskan keupayaan penjanaan kandungan model kecerdasan buatan (AI) Gemini dengan memperkenalkan ciri baharu yang membolehkan pengguna menghasilkan trek muzik selama 30 saat.

Dikuasakan oleh model muzik terbaharu DeepMind, Lyria 3, ciri ini membenarkan penjanaan audio daripada arahan teks, imej, malah video, menjadikan Gemini platform kreativiti pelbagai mod yang lebih menyeluruh.

Ciri penjanaan muzik ini direka untuk memudahkan pengguna mencipta runut bunyi ringkas tanpa memerlukan kemahiran muzik teknikal.

Pengguna boleh memasukkan arahan teks yang memperincikan mood, genre, tempo, atau instrumen yang diingini. Sebagai contoh, lagu bertemakan R&B mengenai sepasang stoking yang kehilangan pasangannya. Lyria 3 seterusnya akan menghasilkan klip audio yang bersesuaian.

Selain teks, model ini juga boleh menganalisis imej atau video yang dimuat naik untuk menghasilkan lirik dan melodi yang sepadan dengan visual tersebut.

Menurut Google, integrasi Nano Banana digunakan untuk mencipta seni album (album art) secara automatik bagi setiap trek yang dihasilkan.

Tempoh masanya dihadkan kepada 30 saat buat masa ini. Namun dilihat strategik untuk kegunaan media sosial dan penciptaan kandungan pendek seperti YouTube Shorts yang akan diintegrasikan melalui ciri “Dream Track”.

Bagi memastikan penggunaan yang bertanggungjawab dan melindungi hak cipta, setiap trek muzik yang dihasilkan oleh Gemini akan ditandakan dengan SynthID. Ia merupakan teknologi tera air (watermark) digital Google yang tidak dapat didengar oleh telinga manusia tetapi boleh dikesan oleh perisian.

Ini membolehkan pengesahan sama ada sesuatu klip audio itu dijana oleh AI atau tidak. Ciri ini kini mula ditawarkan kepada pengguna berumur 18 tahun ke atas pada platform desktop. Buat masa ini sokongan bahasa ditawarkan untuk Bahasa Inggeris, Jerman, Perancis, dan Jepun.

Tinggalkan komentar