AI Voice Cloning Makin Maju, Tingkat Kemiripan Mendekati 100%
Dunia teknologi artificial intelligence sudah sangat berkembang. Produk turunan yang dihasilkan pun sangat eksploratif. Salah satu yang sedang banyak dibicarakan adalah AI Voice Cloning. Bahkan, tingkat kemiripan teknologi ini dengan suara asli dari pemilik suara sudah mencapai 98% hingga 99%.
Hal ini diungkapkan oleh CEO SOCA.AI Jimmy Yogaswara yang juga tengah fokus melakukan pengembangan teknologi AI Voice Cloning.
“Kami sedang fokus ke sintetik media atau konten yang dibuat seluruhnya atau sebagian oleh AI. Salah satunya, kami mengembangkan teknologi voice cloning dan sudah sangat ‘human like’ hasilnya. Sangat mirip dengan suara asli pemilik suara bahkan tingkat kemiripannya sudah lebih dari 90%,” ujar Jimmy kepada Marketeers beberapa waktu lalu.
Menurut Jimmy, AI ini makin seru, apalagi teknologi seperti ChatGPT sudah makin banyak yang open source, sehingga banyak orang bisa membuat ChatGPT Clone, virtual human, atau lainnya. Satu hal yang sulit untuk ditiru adalah emosi manusia.
“Platform voice cloning ini sudah kami luncurkan, kami juga sedang bekerja sama dengan salah satu perusahaan media untuk mengurus intellectual property (IP)-nya,” lanjutnya.
Jimmy menyebut, ada satu tokoh penulis yang mau pihaknya “resurrect” melalui voice cloning. Perusahaan media ini memiliki right terhadap IP dari tokoh yang sudah meninggal dunia ini selama 25 tahun.
BACA JUGA: Soca AI Interact Usung Misi Akselerasi Edukasi Teknologi
“Ketika ini telah terjadi, akan meluas penggunaannya. IP Voice ini akan menjadi the next game changer. Selama ini memang suara seseorang itu belum ada yang dilindungi sebagai IP. Pada akhirnya yang dipatenkan itu adalah brand dan karyanya,” ungkap Pria kelahiran Bandung, Jawa Barat ini.
Menariknya, ke depan orang-orang akan bisa mematenkan suaranya. Hanya saja, pertanyannya sekarang ini daftarnya ke siapa? Hal ini yang sedang SOCA dan tim kejar.
Di sisi lain, Jimmy mengungkapkan bahwa perkembangan AI ke depan akan selalu mengarah ke etika penggunaannya seperti apa. Apakah etis menggunakan voice cloning tanpa sepengetahuan pemiliknya? Hal ini yang menjadi concern besar bagi SOCA.
“Voice cloning ini sangat mudah. Konten di media sosial sudah sangat bertebaran. Dan pembuatnya hanya butuh tiiga recorder dengan kurang dari 1.000 MB, kita bisa melakukan cloning dengan 98%-99% tingkat kemiripannya plus deep fake-nya. Hal ini yang membahayakan dan muncul pertanyaan apakah AI ini akan menjadi distopia atau tidak,” ujar Jimmy.
Perkembangan dan Peluang AI Voice Cloning
Tak hanya di luar negeri, AI dan perusahaan pengembangnya di Indonesia juga mulai ramai. SOCA.AI salah satunya yang sudah diakui perusahaan raksasa global Huawei. SOCA.AI yang berasal dari Bandung ini menjadi Top 9 di ajang Huawei Developer Competition 2023 di wilayah Asia Pasifik.
Jimmy melihat perbedaan pada general AI Company, jika di US sudah dibanjiri funding gila-gilaan hingga bebas berkreasi. Kalau di Indonesia, perusahaan seperti SOCA selalu melihat inovasi ini harus dapat menyelesaikan sebuah persoalan.
BACA JUGA: Dibintangi Kim Bum, Kolaborasi Garut dan Korea Selatan Rilis Film Tanah Air Kedua
“Kami melihat, voice adalah fundamental content yang dapat menjawab persoalan kesenjangan bahasa. Kami ingin menyelesaikan watchable content dengan native language yang familier,” jelas Jimmy.
Jimmy pun mencontohkan konten yang populer dibuat oleh salah satu YouTuber dunia Mr Beast. Satu konten di channel-nya ada 12 audio track yang bisa diisi ke berbagai bahasa. Di sini, dia menjangkau audiens dunia dengan beragam bahasa.
“Orang Indonesia akan mendengarkan hasil dubbing orang Indonesia. Bayangkan, jika itu bisa di-generate dengan AI. Kalau secara manual, dubbing voice secara global cost-nya mencapai US$ 100 per menit dengan waktu produksi hingga 2 minggu untuk 10 menit video. Bayangkan jika bisa dilakukan dengan AI, cost lebih murah dengan waktu 1000% lebih cepat,” tutup Jimmy.