Uygulama ile Aç

"Her": Sam Altman en sevdiği filmi gerçeğe dönüştürdü

OpenAI CEO’su Sam Altman, en sevdiği filmin Spike Jonze’un yönettiği "Her" olduğunu söylemişti. Şimdi ise Altman, en sevdiği filmi GPT-4o ile birlikte gerçeğe dönüştürüyor.

OpenAI, ses, görüntü ve metin arasında gerçek zamanlı olarak mantık yürütebilen yeni amiral gemisi yapay zeka modeli GPT-4o'yu çok kısa bir süre önce duyurdu. Aradan sadece saatler geçmesine rağmen yeni modelin yaptıkları oldukça sarsıcı. Firmaya göre yüz ifadelerinizi okuyabilen ve konuşulan dili gerçek zamanlı olarak tercüme edebilen GPT-4o, farklı duygu türlerini de taklit edebilir. Film guruları bu söylemlerimizi hemen Spike Jonze’un yönettiği "Her" filmi ile bağdaştırabilir. Zira durum tam olarak bu.

Bilmeyenler için, Spike Jonze'un 2013 yapımı Her filminde Joaquin Phoenix, Scarlett Johansson tarafından seslendirilen Samantha adlı bir yapay zeka sanal asistanına aşık olan boşanma sürecindeki kalbi kırık bir adamı canlandırıyor. 2023’ün sonlarına doğru OpenAI CEO’su Sam Altman, katıldığı bir etkinlikte favori filmlerinden birisinin Her olduğunu, insanların yapay zekayı nasıl kullandıklarını sevdiğini ve filmin son derece öngörülü olduğunu söylemişti.

Her filmi artık gerçek

OpenAI ise geçtiğimiz gece GPT-4o'yu canlı yayında tanıtırken ondan robotlar ve aşk hakkında bir hikaye anlatmasını istiyorlar. GPT-4o, OpenAI mühendisleri ve CTO Mira Murati’ye yeteneklerini sergilerden onun sözlerini kesere daha farklı tonlarda hikayeyi anlatmasını istiyorlar. Yapay zeka da sanki odadaki biriymiş gibi yaptığı şeyi yapmaya devam etti.

İlginç bir şekilde Sam Altman, etkinliğin ardından X’te bir paylaşım yaptı ve sadece şunu yazdı: “Her”. Elbette şimdiki haliyle GPT-4o, filmdeki Samantha kadar yetenekli ve gelişmiş değil ancak ona oldukça yakın. Öte yandan OpenAI’ın kendi gelişimine baktığımızda GPT-4o ile atılan adımın büyüklüğünü daha iyi anlıyoruz.

Ayrıca bkz.

OpenAI GPT-4o hakkında merak edilen her şey ve daha fazlası

Hemen üstte GPT-4o’nun detaylarına değindiğimiz içeriğimizde de dediğimiz gibi GPT-4o, firmanın diğer modellerine benzemiyor. Önceki tüm GPT modelleri birkaç farklı modeli kullanarak çalışıyordu. Örneğin bir ses analizi için üç model devreye giriyordu. Ancak GPT-4o ile her şey tek modelde birleşiyor. Ses, metin ve görsel bilgiler tek model tarafından analiz edip çıktıya dönüştürülüyor. Bu da daha hızlı ve yetkin bir modelle sonuçlanıyor.

Örneğin önceki sürümde de bir ses modu vardı ancak ondan bir şey istediğinizde konuşmasının bitmesini beklemeniz gerekiyordu. Ancak GPT-4o’da artık o konuşurken sözünü kesebilir ve yeni bir yönlendirme yapabilirsiniz. Ayrıca artık kameranız aracılığıyla artık dünyayı da görüyor ve gördüklerini keskin bir doğrulukla sizlere aktarabiliyor.

Yeni özellikler önümüzdeki haftalarda sınırlı bir "alfa" sürümüyle kullanıma sunulacak ve daha geniş bir dağıtım başladıktan sonra ilk olarak ChatGPT Plus abonelerine sunulacak. Bazı gelişmiş özellikler ayrıca bugünden itibaren ücretsiz sürüme ve diğer ücretli katmanlara eklenmiş durumda.

İçeriğimizin son bölümünü Sam Altman’ın dün yayınladığı blog yazısındaki cümleleriyle bitirelim: "Yeni ses (ve video) modu şimdiye kadar kullandığım en iyi bilgisayar arayüzü. Filmlerdeki yapay zeka gibi hissettiriyor; ve gerçek olması benim için hala biraz şaşırtıcı. İnsan seviyesinde tepki sürelerine ve ifade gücüne ulaşmak büyük bir değişiklik olacak gibi görünüyor."



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
3 Yorumun Tamamını Gör