Anlık Bildirim

ChatGPT’de görsel devrimi: GPT-4o destekli görsel üretim başladı

OpenAI, ChatGPT’nin görsel üretim yeteneklerini güncelledi. Artık GPT-4o modelini kullanarak ChatGPT içinde çok daha gerçekçi görseller ve doğru metinler oluşturulabiliyor.
ChatGPT’de görsel devrimi: GPT-4o destekli görsel üretim başladı Tam Boyutta Gör
OpenAI, ChatGPT’ye entegre ettiği yeni görüntü üretim özelliğiyle yapay zeka alanında bir adım daha ileri gidiyor. “4o Image Generation” olarak adlandırılan bu özellik, bugünden itibaren tüm kullanıcılar için aktif hale geliyor. Artık kullanıcılar, GPT-4o modelini kullanarak ChatGPT üzerinden doğrudan görseller oluşturabilecek ve düzenleyebilecek.

Yeni özellik, ChatGPT’nin hem ücretli hem de ücretsiz kullanıcılarına sunuluyor. Ücretsiz kullanıcılar için belirli bir üretim sınırı olacak ancak bunun limiti o anki talebe ve yoğunluğa göre değişecek. Daha önce ücretsiz kullanıcılar DALL-E 3 aracılığıyla günde üç görsel üretebiliyordu.

GPT-4o bilindiği üzere metin, görüntü, ses ve video gibi çeşitli veri türlerini üretebilecek kapasiteye sahip. Bu da görsellerdeki detayları artırıyor. Bu modelin dikkat çeken iyileştirmelerinden biri de “bağlama doğruluğu” (binding) olarak öne çıkıyor. Bu özellik, yapay zekanın karmaşık nesne ve özellik ilişkilerini doğru bir şekilde anlamasını sağlıyor. Örneğin, çoğu görüntü modeli bir istemde verilen renk ve şekilleri karıştırabilirken, yeni sistem 15 ila 20 nesneyi doğru şekilde bağlayabiliyor. Bunun yanı sıra model, yüklenen görsellerden de öğrenebiliyor ve bunları referans olarak kullanabiliyor.

Bir diğer güçlü yön ise metin işleme tarafında. Geleneksel yapay zeka modelleri görsellerde metin oluştururken sıklıkla yazım hataları yaparken, GPT-4o bu hataları önemli ölçüde azaltıyor. OpenAI, yeni görüntü özelliğini desteklemek için GPT-4o'yu "kamuya açık veriler" ve Shutterstock gibi şirketlerle yaptığı ortaklıklardan elde ettiği tescilli veriler üzerinde eğittiğini söyledi.

Üretimde otoregresif yaklaşımı

ChatGPT’de görsel devrimi: GPT-4o destekli görsel üretim başladı Tam Boyutta Gör
DALL-E gibi çoğu görsel üreten modeller tüm görüntüyü tek bir kerede oluşturan difüzyon modeli tekniğini kullanıyor. Ancak OpenAI, burada bir farklılığa giderek görüntüleri satır satır ve sütun sütun oluşturan otoregresif bir yaklaşım kullanıyor. Bu teknik farklılık, özellikle karmaşık metin ve nesne ilişkilerinde doğruluğu artırıyor.
ChatGPT’de görsel devrimi: GPT-4o destekli görsel üretim başladı Tam Boyutta Gör
Yeni özellik, bilimsel diyagramlar, çok panelli çizgi romanlar ve bilgi afişleri gibi karmaşık görsel taleplere yanıt verebiliyor. Ayrıca, şeffaf arka planlı çıkartmalar, restoran menüleri ve logolar gibi pratik tasarımlar için de kullanılabiliyor. Dolayısıyla yeni araç hem profesyonel hem de kişisel kullanıma hitap ediyor. Ek olarak OpenAI, üretim sırasında modelin dünya bilgisine de başvuruluyor. Newton’un prizma deneyini istediğinizde ayrıntı vermeden görseli bu sayede üretebiliyor. İsterseniz görselde metin açıklamaları da yapıyor. Görsel üretimi ise eskiye göre biraz daha uzun sürüyor.

Güvenlik ön planda

ChatGPT’de görsel devrimi: GPT-4o destekli görsel üretim başladı Tam Boyutta Gör
OpenAI, görsel üretim aracının kötüye kullanımını önlemek için kapsamlı güvenlik önlemleri aldığını vurguluyor. Sistem, müstehcen içerik üretimini engelliyor ve telif hakkı işaretlerini kaldırmaya yönelik girişimleri reddediyor.

Her ne kadar görsellerde doğrudan bir filigran olmasa da, OpenAI tüm görsellerde C2PA meta verilerini kullanarak bunların yapay zeka tarafından üretildiğini işaretliyor.

4o Image Generation nasıl kullanılır?

4o Image Generation, ChatGPT'de varsayılan görüntü oluşturucu olarak bugün itibarıyla Plus, Pro, Team ve Ücretsiz kullanıcılarına sunuluyor. Hesabınızda aktif hale gelmesi biraz zaman alabilir. Yakında Enterprise ve Edu'ya da erişim sağlanacak. Ayrıca Sora'da da kullanılabilir.

Geliştiriciler ise yakında API üzerinden GPT‑4o ile görüntü üretebilecekler ve erişim önümüzdeki birkaç hafta içinde sağlanacak.

Görüntüleri oluşturmak ve özelleştirmek ChatGPT ile sohbet etmek kadar kolay. Sadece en boy oranı, hex kodları kullanarak kesin renkler veya şeffaf bir arka plan gibi herhangi bir ayrıntı dahil olmak üzere neye ihtiyacınız olduğunu açıklayarak görsel üretebilirsiniz.

Aşağıdaki galeriden örnek görsellere göz atabilirsiniz.

Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Tavsiyelerimiz

Yeni Haber
şimdi
Geri Bildirim