OpenAI o3 tanıtıldı: İşte tarihin “en zeki” yapay zekası

Yapay zekanın lider şirketi OpenAI, “12 Days of OpenA” kapsamında on iki gün boyunca çeşitli tanıtımlar ve duyurular gerçekleştirdi. Bu uzun etkinliğin son gününde ise firmanın “düşünebilen” yapay zeka modeli olan o1’in yeni sürümü olan OpenAI o3 ve OpenAI o3-mini tanıtıldı. Firma yeni yapay zeka modelinin mevcut modellerden daha insan benzeri muhakeme yeteneğine sahip olduğunun altını çizdi.

OpenAI o3 ile yeni bir dönem başlıyor

Google'ın bu türdeki ilk modelini duyurmasından sadece bir gün sonra OpenAI, bugüne kadarki en yetenekli yapay zeka modelinin geliştirilmiş bir versiyonunu - sorular üzerinde düşünmek için daha da fazla zaman alan – ile karşımıza çıkıyor. OpenAI o3, tıpkı o1 gibi sorulara daha iyi yanıtlar verebilmek için “kafa yorarak zaman geçiriyor” ve bu süreçte mantıksal akıl yürütme gerçekleştiriyor.

OpenAI o3, özellikle karmaşık matematik, ileri düzey bilim soruları ve kodlama gibi alanlarda önceki modelden üç kat daha iyi performans gösteriyor. Model, ARC-AGI gibi yapay zekaların mantıksal çıkarım yeteneklerini test eden bir benchmarkta da üstün başarı sağlıyor.

o3, mantıksal düşünme gerektiren problemleri adım adım çözme konusunda eğitim almış bir model. OpenAI, bu yöntemin yapay zekanın karmaşık sorunları çözme kabiliyetini önemli ölçüde artırdığını belirtiyor. Şirket, O3'ün, SWE-Bench gibi bir modelin problem çözme kapasitesini ölçen testlerde, o1'den yüzde 20 daha iyi performans sergilediğini açıkladı.

Neden o2 değil de o3?

Detaylara girmeden önce hemen akıllara gelen ilk soruyu cevaplandıralım: Neden o2 değil de o3? o2’nin kullanılmamasının ardında, İngiliz telekomünikasyon şirketi O2 ile yaşanabilecek olası bir ticari marka ihtilafı olduğu belirtiliyor.

Bununla birlikte o3 ve o3-mini henüz genel kullanıma sunulmuş değil. Ancak, güvenlik araştırmacıları bugünden itibaren bir önizleme sürümüne erişim için başvurabilecekler. OpenAI CEO’su Sam Altman’ın açıklamalarına göre, bu yeni modellerin geniş çaplı kullanılabilir hale gelmesi biraz zaman alabilir.

AGI’ye bir adım daha

o3, o1 gibi, yanıt üretmeden önce “özel bir düşünce zinciri” üzerinden mantık yürütebiliyor. Bu süreç, modelin kendini adeta “kontrol etmesini” sağlıyor ve yanlış bilgilendirme riskini azaltıyor. Fizik, bilim ve matematik gibi karmaşık alanlarda güvenilirliği artıran bu yöntem, aynı zamanda bir dezavantajı da beraberinde getiriyor: Yanıt süresi. Geleneksel modellerden farklı olarak o3, çözüm üretmek için daha fazla zaman harcıyor.

O3’ün asıl farkı, bir görevi yerine getirirken birkaç adımı önceden planlayarak çözüm odaklı bir süreç oluşturması. Verilen bir komutu yanıtlamadan önce, ilgili konuları değerlendirip mantığını açıklıyor ve ardından en doğru cevabı özetliyor. Ek olarak modeller düşük, orta veya yüksek düşünme süresine ayarlanabiliyor.

OpenAI’nin bu yeni modelleri yapay genel zeka (AGI) konusundaki tartışmaları da yeniden gündeme taşıyor. AGI, insanın yapabileceği hemen her görevi gerçekleştirebilen yapay zekâ sistemlerini ifade ediyor. OpenAI’nin AGI’ye dair kendi tanımı ise “ekonomik olarak değerli işlerin çoğunda insanlardan daha iyi performans gösteren son derece otonom sistemler.”

o3’ün AGI’ye ne kadar yaklaştığını anlamak için ARC-AGI test sonuçları referans alınabilir. Bu testte o1, yüzde 25 ile yüzde 32 arasında bir başarı oranı yakalayabiliyor. İnsan düzeyine ulaşmak için gereken oran yüzde 85 olsa da bu sonuçlar, önemli bir ilerlemeye işaret ediyor. Ancak sıkı durun. o3’ün bu testten aldığı skor ise yüzde 87.5! o1'in performansının üç katına çıkıyor ve bu oranlara daha önce yaklaşılamamıştı bile.

Diğer kıyaslamalarda da o3 yine rakiplerini geride bırakmayı başarıyor. AIME 2024'te sadece bir soru kaçırarak yüzde 96,7 puan alıyor ve GPQA Diamond'da yüzde 87,7'ye ulaşıyor. Model ayrıca bilinen en zorlu değerlendirmelerde yeni rekorlar kırarak, başka modellerin yüzde 2’yi bile aşamadığı EpochAI's Frontier Math'da problemlerin yüzde 25,2'sini çözüyor. Buradaki matematik problemlerini bu konuda uzman kişilerin çözmesi bile bazen günler sürebiliyor.

OpenAI o3 ne zaman çıkacak ve nasıl kullanılır?

OpenAI o3 ve o3-mini kullanıma sunulmadı ve halen modeller test sürecinde. OpenAIayrıca güvenlik ve emniyet araştırmacılarından, yeni yazılımları piyasaya sürmeden önceki sürecin bir parçası olarak modelleri test etmek üzere başvuruda bulunmalarını istiyor.

OpenAI CEO’su Sam Altman etkinlik sırasında yaptığı açıklamada, o3-mini modelinin Ocak 2025 tarihinde, o3 modelinin ise Ocak ayından kısa bir süre sonra piyasaya sürmeyi planladığını söyledi. Bu modeller öncelikli olan ChatGPT Plus ve Pro abonelerine sunulacak.

OpenAI, model önizlemeleriyle birlikte, o1 ve o3 gibi sistemlerin doğru şekilde çalışmasını ve örneğin kullanıcıların yasa dışı faaliyetlerde bulunmasına yardımcı olmaktan kaçınmasını sağlamak için kullandığı yeni bir yaklaşımı tanımlayan bir araştırma da yayınladı. “Deliberative alignment” (düşünceli hizalama) adı verilen bu teknik, modellerin bir kullanıcının sorusuna yanıt vermeden önce bir dizi güvenlikle ilgili adımı takip etmesini sağlayacak.

(Güncellendi: 20.12.2024, 21:48)

Haberi DH'de Gör Yorumlar ve Diğer Detaylar