Ses klonlama sistemleri zaten uzunca bir süredir hayatımızda ancak doğru ve gerçekçi bir klonlama için önceden çok fazla ses verisine ihtiyaç duyuluyordu. Haftalar süren düzenlemeler ile başarılı bir klonlama yapılabiliyordu. Ancak yapay zeka ile tüm süreç birkaç saate indi. Artık birisinin sesini klonlamak için sadece birkaç saniyelik ses verisi yeterli oluyor. Meta’nın Voicebox'ı ise ses kliplerinin arka planından araba kornalarını, köpek havlamasını veya benzer arka plan gürültülerini de kaldırabiliyor.
Görme engelliler için kullanılacak
Elbette Voicebox’un amacı kötü bir şey yapmak değil. Voicebox, görme engelli kişilerin arkadaşlarından ve ailelerinden gelen yazılı mesajları duymalarına yardımcı olmak için kullanılacak. Meta, Voicebox'ın çok dilli olduğunu, altı dilde akıcı olduğunu ve kullanıcıların herhangi bir yabancı dili kendi sesleriyle konuşabileceklerini belirtiyor. Diller arasında İngilizce, Fransızca, Almanca, İspanyolca, Lehçe veya Portekizce bulunuyor.
Peki nasıl çalışıyor? Aslında oldukça basit. Bir kullanıcı Voicebox'a sesinden bir örnek veriyor. Bu örnek iki saniyelik veya daha uzun bir klip olabilir. Yapay zeka buradan yola çıkarak sesi tahmin ediyor ve kullanıcının gerçekçi ses stilini oluşturuyor.
Öte yandan şimdiden Voicebox bazı önemli etik soruları gündeme getirdi çünkü insanlar artık sevdiklerinin, en iyi arkadaşlarının ve hatta düşmanlarının seslerini iki saniye kadar kısa bir sesle taklit edebilecekler. Böyle bir teknolojinin istenmeyen ciddi sonuçları olabilir. En basitinden bankaların sesli yanıt sistemleri kandırılabilir.
Meta böyle bir teknolojinin potansiyel tehlikesinin farkında ve neyse ki Voicebox'ın temel kodunu gizli tutuyor. Şirket araştırma bloğunda "Üretken konuşma modelleri için birçok heyecan verici kullanım alanı var, ancak potansiyel kötüye kullanım riskleri nedeniyle Voicebox modelini veya kodunu şu anda kamuya açık hale getirmiyoruz" diye yazdı.
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}