- Meta, istenilen kişinin sesini kopyalayan yapay zekâ sistemi Voicebox’ı duyurdu
- Çatı şirket Meta, ses klonlamak için kullanılacak yeni yapay zekâ aracını duyurdu.
Meta, altı dilde konuşabilen ve 2 saniyelik sesle istenilen kişinin sesini kopyalayan yapay zekâ sistemi Voicebox’ı duyurdu. Meta, Voicebox’ı “konuşma için üretken bir yapay zekâ” olarak görüyor. Voicebox sayesinde seslerde sorun yaratan arka plan gürültüsü de çözülecek.
Ses klonlama sistemleri zaten belli bir süredir hayatımızda yer alıyordu ancak doğru ve gerçekçi klonlama için daha fazla ses verisine ihtiyaç vardı. Günler süren düzenlemelerin sonucunda düzgün ve gerçekçi bir ses klonlaması ancak yapılabiliyordu. Bu durum yapay zekâ sayesinde daha da kısaldı. Artık istediğiniz birinin sesini klonlamak için sadece birkaç saniyelik kısa ses kaydı verisi yeterli oluyor. Meta’nın Voicebox’ı ses kliplerinin arka planında gürültü olarak adlandırılan sesleri de kaldırabiliyor.
Voicebox’un amacı görme engelli kullanıcıların yaşamını kolaylaştırmak
Yapay zekânın kötüye kullanım oranı, deepfake vb. uygulamalar yüzünden son derece arttı ancak Voicebox’un amacı ses verilerini kötüye kullanmak değil. Voicebox, görme engelli kullanıcıların arkadaşlarından ve ailelerinden gelen yazılı mesajları duymalarına yardımcı olacak. Meta, Voicebox’un altı dilde akıcı olarak konuştuğunu ve kullanıcıların herhangi bir yabancı dili kendi sesleriyle konuşabileceklerini de belirtiyor. Hizmet sunulan diller arasında İngilizce, Fransızca, Almanca, İspanyolca, Lehçe ve Portekizce bulunuyor.
Voicebox nasıl çalışıyor?
Herhangi bir kullanıcı Voicebox’a kendi sesinden bir örnek yüklüyor. Bu örnek iki saniye ya da daha uzun olabilir. Yapay zekâ yüklenen örneği dikkate alarak ses analizi yapıyor ve yükleyen kullanıcının sesine en yakın olan stilini yaratıyor.
Voicebox’ın ortaya çıkış fikri her ne kadar güzel olsa da bazı etik sorunlardan çekiniliyor. Kullanıcılar artık kişisel çıkarları için diğer kullanıcıların fotoğraflarını ve seslerini kötü amaçlar çerçevesinde kullanıyorlar. Meta bu durumun farkında ve bu yüzden de Voicebox’ın kodunu gizli tutuyor. Şirket konuyla ilgili yaptığı açıklamada “Üretken konuşma modelleri için birçok heyecan verici kullanım alanı bulunuyor, potansiyel kötüye kullanım riskleri yüzünden Voicebox modelini veya kodunu şu anda kamuya açık hale getirmiyoruz.” dedi.
Derleyen: Sarper Kaçar