Üretken yapay zeka yarışı
Şimdiye kadar teknoloji haberlerinin en sıradan takipçileri bile ChatGPT, Stable Diffusion, Midjourney ve DALL-E gibi üretken yapay zeka araçlarından haberdardır. Dünyanın en büyük 5 şirketi en iyi büyük dil modellerini geliştirmek ve bunları kullandığımız her yazılım veya web hizmetine dahil etmek için yarışıyor. Bu araçlar, istemleri kullanarak yararlı görüntüler veya metinler üretebiliyor. Öte yandan bu araçların çoğu insanlar tarafından yazılan eserler üzerinde "eğitiliyor" ve çıktılarını anlamlı bir düzeye çıkarmak için insan gözetimi gerektiriyor.
Ücretsiz ChatGPT iOS uygulaması yayınlandı
DragGAN ile görsel düzenlemede devrim
Bununla birlikte, yapılan yeni yapay zeka araştırması, özellikle görüntü manipülasyonu alanındaki inanılmaz ilerlemeyi gözler önüne seriyor. Google, MIT, Pennsylvania Üniversitesi ve Almanya'daki Max Planck Bilişim Enstitüsü'nden bir grup bilim insanı, görüntü düzenlemeyi sıradan insanlar için daha kolay ve erişilebilir hale getirebilecek deneysel bir araç geliştirdi.
DragGAN olarak adlandırılan yeni aracın neler yapabildiğini anlamak için sadece bu haber içindeki örneklere bakmak yeterli. Sadece birkaç tıklama ve birkaç saniye ile görselde bulunan objeyi 3D modelmiş gibi döndürmek, yüz ifadelerini değiştirmek veya aklınıza gelebilecek diğer zorlu düzenlemeleri yapmak mümkün. Bu arada DragGAN’ın halka açık bir model olmadığını da belirtelim. Dolayısıyla aracı deneme imkanımız olmadı.
Hayalinizdeki sahne sadece birkaç saniye uzakta
Araştırmacılar, DragGAN'ın Nvidia'nın GeForce RTX 3090 grafik kartı kullanıldığında bir görüntünün içeriğini sadece birkaç saniye içinde değiştirebileceğini, çünkü uygulamalarının istenen sonuçları elde etmek için birden fazla sinir ağı kullanmasına gerek olmadığını belirtiyor. Bir sonraki adım, 3D modellerin nokta tabanlı düzenlenmesi için benzer bir model geliştirmek olacak.
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}