Google VLOGGER, fotoğraflara can veriyor
Google VLOGGER yapay zeka modeli, girdi olarak bir kişinin fotoğrafını ve bir ses kaydını kullanarak ortaya son derece gerçekçi sonuçlar çıkartabiliyor. Model, kişinin sesiyle eşleşecek şekilde kelimeleri konuşturabiliyor ve buna karşılık gelen el ve yüz hareketlerini yapabilen videolar üretebiliyor. Elbette videolar mükemmel olmaktan uzak ancak hareketsiz görüntüleri canlandırma becerisinde önemli bir eşiğe ulaşıldığı görülüyor.
Google Research'ten Enric Corona liderliğindeki araştırmacılar, VLOGGER’da difüzyon modelleri adı verilen bir tür makine öğrenimi modelinden yararlandılar. Difüzyon modelleri son zamanlarda metin istemlerinden gerçekçi görüntüler üreten yapay zekalarda kullanılıyordu. Ekip, bu modelleri video alanına çekerek ve geniş bir veri kümesi üzerinde eğiterek fotoğraflara son derece ikna edici bir şekilde hayat verebilen bir yapay zeka sistemi oluşturmayı başardı.
Araştırmada yazarlar, VLOGGER’ın önceki yöntemlerin aksine her bir kişi için eğitim gerektirmediğini, yüz algılama ve kırpmaya dayanmadığını ve tüm görüntüyü tek seferde ürettiğini belirtiyor. MENTOR adı verilen ve 800.000'den fazla farklı kimlik ve 2.200 saatlik video üzerinde eğitilen VLOGGER, dublaj ve video düzenleme alanında potansiyel olarak kullanılabilir. Bu teknoloji aynı zamanda sanal gerçeklik ve oyunlar için fotogerçekçi avatarlar yaratmak için de kullanılabilir. Ayrıca daha ilgi çekici ve etkileyici yapay zeka destekli sanal asistanların ve sohbet robotlarının oluşturulmasına da olanak sağlayabilir.
İyi kullanım senaryolarıyla birlikte bu teknoloji, örneğin bir videodaki kişinin yerine başka birinin benzerinin yerleştirildiği deepfake'lerin oluşturulması gibi kötüye kullanım potansiyeline de sahip. Yapay zeka tarafından üretilen bu videolar daha gerçekçi ve daha kolay oluşturulur hale geldikçe, yanlış bilgilendirme ve dijital sahtecilikle ilgili zorluk daha büyük bir sorun olmaya başlıyor. Bu nedenden dolayı VLOGGER şimdilik sadece bir araştırma modeli olarak mevcut durumda.
Kaynakça https://enriccorona.github.io/vlogger/ https://www.tomsguide.com/ai/google-gemini/googles-new-vlogger-ai-lets-you-create-a-lifelike-avatar-from-just-a-photo-and-control-it-with-your-voice Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Bana çok korkutucu geliyor bunlar.