Google secara rasminya telah melancarkan Gemini 3.5 Live Translate. Model audio baharu yang memfokuskan kepada kemampuan terjemahan suara-ke-suara (speech-to-speech) secara hampir masa nyata.

Tidak seperti teknologi terjemahan tradisional yang memerlukan pengguna menunggu giliran (turn-by-turn) selepas satu ayat dihabiskan, Gemini 3.5 Live Translate berfungsi seperti jurubahasa serentak.

Model kecerdasan buatan (AI) ini secara berterusan memproses aliran audio. Ia membolehkan sistem mendengar dan menterjemah serentak dengan kadar kependaman atau masa lengah yang hanya mengambil masa beberapa saat.

Model canggih ini mampu menyokong dan mengesan lebih daripada 70 bahasa secara automatik secara terus meskipun pengguna berada di dalam persekitaran yang bising.

Lebih menakjubkan, inovasi ini direka khusus untuk mengekalkan keaslian penutur asal. Ia berupaya mengekalkan aspek intonasi, kelajuan percakapan, dan nada (pitch) suara individu. Sekaligus mengelakkan terjemahan tersebut daripada kedengaran kaku seperti robot.

Ketersediaan Platform Mengikut Pengguna

Sistem Gemini 3.5 Live Translate ini mula digerakkan secara berperingkat ke seluruh ekosistem produk Google, merangkumi pelbagai demografi pengguna. Antaranya:

  • Pengguna Umum: Ciri ini tersedia secara global melalui aplikasi Google Translate untuk peranti Android dan iOS. Khusus untuk platform Android, pengguna turut menerima akses kepada mod pendengaran bebas tangan (hands-free) yang disalurkan terus melalui sistem bunyi peranti.
  • Pembangun Perisian (Developer): Model ini boleh diakses untuk versi pratonton awam (public preview) bagi membolehkan pihak pembangun mengintegrasikan AI ini melalui Gemini Live API (Antaramuka Pengaturcaraan Aplikasi) dan Google AI Studio.
  • Sektor Korporat (Enterprise): Syarikat korporat dan pelanggan Google Workspace yang terpilih akan mula menguji model ini dalam platform telesidang Google Meet melalui versi pratonton peribadi (private preview) bermula bulan ini.

Bagi membuktikan kemampuan operasi berskala besar, teknologi ini telah pun diaplikasikan dalam industri dunia sebenar. Syarikat penyedia perkhidmatan p-hailing, Grab, telah pun mengintegrasikan teknologi terjemahan ini sebagai medium melancarkan berjuta-juta panggilan operasi di seluruh dunia.

Tinggalkan komentar