Seolah Tak Mau Kalah, Microsoft Luncurkan Simulator Peniru Suara Orang
Tekno

Tak Mau Kalah dari ChatGPT, Microsoft Luncurkan Simulator Peniru Suara Orang Secara Akurat

  • Microsoft meluncurkan simulator suara AI yang diklaim mampu meniru suara seseorang secara akurat setelah mendengarkan mereka bicara hanya dalam waktu tiga detik.
Tekno
Justina Nur Landhiani

Justina Nur Landhiani

Author

JAKARTA - Tahun 2022 lalu, ChatGPT membuat banyak orang takjub akan kemampuannya memudahkan tugas banyak orang. ChatGPT dari OpenAI ini sendiri merupakan sebuah chatbot yang termasuk dalam platform kecerdasan buatan penghasil teks OpenAI. 

Seolah tidak mau kalah, Microsoft juga telah meluncurkan simulator suara AI yang diklaim mampu meniru suara seseorang secara akurat setelah mendengarkan mereka bicara hanya dalam waktu tiga detik.

Simulator ini menggunakan model bahasa VALL-E dilatih menggunakan percakapan bahasa Inggris selama 60.000 jam dari 7.000 penutur berbeda untuk mensintesis ucapan personal berkualitas tinggi dari pembicara yang tidak terlihat. Diketahui, Microsoft melatih VALL-E menggunakan rekaman suara di domain publik, kebanyakan berasal dari buku audio LibriVox, sedangkan speaker atau pembicara yang ditiru ikut serta dalam eksperimen dengan sukarela.

Setelah sistem kecerdasan buatan tersebut memiliki rekaman suara seseorang, maka sistem tersebut dapat membuatnya terdengar seperti orang tersebut sedang mengatakan sesuatu. Sistem tersebut juga mampu meniru nada emosional dan lingkungan dari pembicara asli.

Seperti yang dilansir dari laman The Independent, hasil eksperimen menunjukkan bahwa VALL-E ini mampu mengungguli sistem zero-shot text to speech synthesis (TTS) dalam hal kealamian ucapan dan kesamaan pembicara. VALL-E juga diklaim dapat mempertahankan emosi pembicara dan lingkungannya.

Namun, seperti halnya teknologi deepfake lain yang dapat meniru kemiripan visual seseorang dalam video, ada potensi penyalahgunaan dari simulator ini. Perangkat lunak ini juga masih tidak tersedia untuk digunakan secara umum untuk mencegah penyalahgunaan, pemalsuan identifikasi suara atau meniru identitas pembicara tertentu.

Oleh karena itu, Microsoft mengatakan akan mematuhi prinsip AI yang bertanggung jawab karena terus mengembangkan VALL-E, serta mempertimbangkan cara untuk mendeteksi ucapan yang disintesis untuk mengurangi risiko tersebut.