Uygulama ile Aç

En yakın arkadaşınızın sesini klonlayabileceğiniz yapay zeka aracı geliştirdi

Yapay zeka araçları gün geçtikte daha da gelişiyor. Hızla yaşanan büyüme bazı riskleri de beraberinde getiriyor. Öte yandan Meta, bir süre önce kendi ses klonlama yapay zekasını duyurdu.

Meta, altı dilde konuşabilen ve sadece 2 saniyelik ses verisiyle istenilen kişinin sesini kopyalayabilen metinden konuşmaya yapay zeka sistemi Voicebox'ı duyurdu. Meta, Voicebox'ı "konuşma için üretken yapay zekada bir atılım" olarak nitelendiriyor. Üstelik bu araç sayesinde ciddi bir sorun olan arka plan gürültüsünün de üstesinden gelindiği belirtiliyor.

Ses klonlama sistemleri zaten uzunca bir süredir hayatımızda ancak doğru ve gerçekçi bir klonlama için önceden çok fazla ses verisine ihtiyaç duyuluyordu. Haftalar süren düzenlemeler ile başarılı bir klonlama yapılabiliyordu. Ancak yapay zeka ile tüm süreç birkaç saate indi. Artık birisinin sesini klonlamak için sadece birkaç saniyelik ses verisi yeterli oluyor. Meta’nın Voicebox'ı ise ses kliplerinin arka planından araba kornalarını, köpek havlamasını veya benzer arka plan gürültülerini de kaldırabiliyor.

Görme engelliler için kullanılacak

Elbette Voicebox’un amacı kötü bir şey yapmak değil. Voicebox, görme engelli kişilerin arkadaşlarından ve ailelerinden gelen yazılı mesajları duymalarına yardımcı olmak için kullanılacak. Meta, Voicebox'ın çok dilli olduğunu, altı dilde akıcı olduğunu ve kullanıcıların herhangi bir yabancı dili kendi sesleriyle konuşabileceklerini belirtiyor. Diller arasında İngilizce, Fransızca, Almanca, İspanyolca, Lehçe veya Portekizce bulunuyor.

Peki nasıl çalışıyor? Aslında oldukça basit. Bir kullanıcı Voicebox'a sesinden bir örnek veriyor. Bu örnek iki saniyelik veya daha uzun bir klip olabilir. Yapay zeka buradan yola çıkarak sesi tahmin ediyor ve kullanıcının gerçekçi ses stilini oluşturuyor.

Öte yandan şimdiden Voicebox bazı önemli etik soruları gündeme getirdi çünkü insanlar artık sevdiklerinin, en iyi arkadaşlarının ve hatta düşmanlarının seslerini iki saniye kadar kısa bir sesle taklit edebilecekler. Böyle bir teknolojinin istenmeyen ciddi sonuçları olabilir. En basitinden bankaların sesli yanıt sistemleri kandırılabilir.

Ayrıca bkz.

ChatGPT kullanan avukata para cezası kesildi! Peki ama neden?

Meta böyle bir teknolojinin potansiyel tehlikesinin farkında ve neyse ki Voicebox'ın temel kodunu gizli tutuyor. Şirket araştırma bloğunda "Üretken konuşma modelleri için birçok heyecan verici kullanım alanı var, ancak potansiyel kötüye kullanım riskleri nedeniyle Voicebox modelini veya kodunu şu anda kamuya açık hale getirmiyoruz" diye yazdı.



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
8 Yorumun Tamamını Gör