o1'deki yöntem kullanılacak
OpenAI'ın en son duyurduğu "o1" adlı model, geleneksel büyük dil modellerinden farklı olarak sorunları insan benzeri bir mantıkla çözme yeteneğine sahip. Bu model, standart eğitim sürecinin yanı sıra, uzmanlardan alınan geri bildirimler ve veri ile şekillendirilen yeni bir yaklaşımı temel alıyor. o1, AI'nin daha insansı ve çok adımlı bir düşünce süreci yürütebilmesine imkan tanıyor.
OpenAI’ın bu yeni modeli, eğitilmiş büyük dil modellerine ek olarak, modellerin çıkarım aşamasında (inference) daha fazla işlem gücü kullanabilmesine olanak sağlayan “test-time compute” tekniğini uyguluyor. Bu teknik, modelin karmaşık matematiksel problemler veya kodlama gibi görevlerde daha etkin performans göstermesini sağlıyor. Örneğin, bir model hemen tek bir yanıt seçmek yerine, gerçek zamanlı olarak birden fazla olasılık üretip değerlendirebilir ve sonuçta ileriye dönük en iyi yolu seçebilir.
2010'ların AI dünyasında “daha fazla veri ve daha fazla hesaplama gücüyle” büyük gelişmeler elde edildiği düşünülüyordu. Ancak bu yıl şirketten ayrılarak SSI’ı kuran eski OpenAI kurucularından Ilya Sutskever, artık yalnızca veri ve işlem gücünü artırarak elde edilen sonuçların sınırına ulaştıklarını belirtiyor: “2010'lar ölçeklendirme çağıydı, şimdi yeniden merak ve keşif çağındayız. Herkes bir sonraki şeyi arıyor. Doğru şeyi ölçeklendirmek şimdi her zamankinden daha önemli.”
“Daha büyük daha iyidi” felsefesine alternatif yaklaşımlar
Bu bağlamda, veri ve enerji kaynaklarının tüketiminde yaşanan sıkıntılar, AI firmalarını daha verimli ve insansı yöntemler geliştirmeye yönlendiriyor. Günümüz AI modelleri, mevcut verilerin büyük bir kısmını zaten tüketmiş durumda ve artan enerji maliyetleri nedeniyle eğitim süreçlerinde aksaklıklar yaşanabiliyor. Bu nedenle OpenAI ve diğer öncü laboratuvarlar, daha gelişmiş modeller yaratmak için alternatif yöntemlere yöneliyor.
OpenAI'da istifalar devam ediyor
Bu gelişmeler, AI modellerinin çalıştırılma sürecinde daha düşük maliyetli ve daha verimli donanımlara olan talebi artırıyor. Şimdiye kadar hem eğitim hem de çıkarımda Nvidia’nın pahalı GPU’ları kullanıldı. Ancak burada değişimin ayak sesleri duyulmaya başlanıyor. Firmalar, çıkarım süreçlerinde daha düşük maliyetli donanımlara daha fazla ihtiyaç duymaya başlıyor. Sequoia Capital'in ortaklarından Sonya Huang Reuters'a verdiği demeçte, “Bu değişim bizi devasa ön eğitim kümeleri dünyasından, çıkarım için dağıtılmış, bulut tabanlı sunucular olan çıkarım bulutlarına taşıyacak” diyor.
Sonuç olarak yeni yaklaşımlar, AI geliştirme sürecinde daha karmaşık ancak daha insan benzeri düşünme yeteneklerine sahip modeller oluşturmayı amaçlıyor. OpenAI ürün müdürü Kevin Weil, geçtiğimi ay, “Bu modelleri çok hızlı bir şekilde daha iyi hale getirmek için koparabileceğimiz çok sayıda kolay ulaşılabilir meyve görüyoruz. İnsanlar bize yetişene kadar, biz üç adım daha önde olmaya çalışacağız.” dedi.
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}