Uygulama ile Aç

Bu yapay zekanın ürettiği videolar “yok artık” dedirtiyor

Çinli teknoloji devi ByteDance’in yapay zekadaki atılımı hız kesmeden devam ediyor. TikTok’un sahibi olan ByteDance, Goku ve Goku+ adında video üreten yeni yapay zekalar tanıttı.

Hong Kong Üniversitesi ve TikTok’un sahibi olan Çinli teknoloji devi ByteDance’in araştırmacılarının yer aldığı çalışmadan Goku ve Goku+ adında video üreten yeni yapay zekalar ortaya çıktı. Akış tabanlı video modelleri olarak tanımlanan Goku, gerçekçilik konusunda sınırları fazlasıyla zorluyor. Goku ile sosyal medyada yapay zeka “influencer” ve ürün tanıtımı patlamasına bir adım daha atarak oldukça yaklaşıyoruz.

Goku, video üretiminde zirveye oynuyor







Yapay zeka destekli görsel üretim modelleri son yıllarda büyük bir ivme kazandığı bir gerçek ve çoğu artık şaşırtmıyor. Ancak Goku adlı yeni model ailesi, sektör standartlarını yeniden tanımlayacak özellikleriyle dikkat çekiyor. Goku, görüntü ve video üretimini birlikte ele alan bir model ailesi olarak öne çıkıyor. Rectified flow Transformers (düzeltilmiş akış transformatörleri) adı verilen özel bir teknik sayesinde görüntü ve video verileri arasındaki etkileşimi daha akıcı ve uyumlu hale getiriyor. Bu sayede hem metinden görüntüye hem de metinden videoya dönüşümde rakiplerine kıyasla daha yüksek kalite sunuyor.

Araştırma makalesinde firma, Goku’nun hem niteliksel hem de niceliksel değerlendirmelerde üstün performans göstererek başlıca görevlerde yeni standartlar belirlediğine dikkat çekiyor. Yapılan kıyaslamalarda ise OpenAI Sora’dan daha güçlü olduğuna dikkat çekiliyor. Bazı kategorilerde küçük farklarla geçilse de Goku, genel skorda halihazırda en iyi video üretim modeli olarak nitelendiriliyor.

Ayrıca bkz.

Yapay zeka ile video kalitesi artırma

Goku, anlaşılacağı üzere piyasada olanlar gibi çok modlu (ses, görüntü, video) bir model. Ancak diğer modellerde görüntü ve video oluşturma ayrı olarak yapılıyordu. Goku’nun yeni tekniği ise görüntü ve video sentezini birleştirerek fark yaratıyor.

Goku+ ile yapay zeka reklamlar çağı başlıyor







Bu arada bir parantez de Goku+’a açmak lazım. bu, Goku’nun üzerine inşa edilmiş bir model ancak insanları ve ürünleri içeren reklamları optimize etmek için özel olarak tasarlanmış. Firmaya göre Goku+, reklam videolarını 100 kat daha düşük maliyetle oluşturabiliyor.

Goku+, metni hiper-gerçekçi insan videolarına dönüştürerek mevcut yöntemlerden önemli ölçüde daha iyi performans gösteriyor. Özellikle, sabit el hareketleri ve insan deneklerin son derece etkileyici yüz ve vücut hareketlerini içeren 20 saniyeden uzun videolar oluşturabiliyor. Goku+, ürün görsellerini de doğrudan video kliplerine dönüştürebiliyor. Bu, özellikle e-ticaret platformları için çok kullanışlı olabilir.



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
8 Yorumun Tamamını Gör