Google, Gemini videosunda insanları aldattı mı?
[twitter= https://twitter.com/OriolVinyalsML/status/1732885990291775553]6 dakikalık demo videosunda Gemini görüntüleri tanıyor, saniyeler içinde yanıt veriyor, fincan numarasında bardağın altına gizlenen kağıdı doğru şekilde takip edebiliyor ve daha fazlasını yapabiliyordu. Ancak bu video biraz gerçek olmayacak kadar iyiydi. Nitekim Google’da bunu kabul ediyor. Bu video tüm dünyaya hızlı bir şekilde yayılırken altındaki açıklama kısmı gözlerden kaçmış gibi: “Bu demonun amaçları doğrultusunda, gecikme süresi azaltılmış ve Gemini çıktıları kısa olması için kısaltılmıştır.” Bu açıklama diğer videolarda bulunmuyor.
Öte yandan bu durum infial yaratılacak bir şey değil. Çünkü şirketler demo videolarında bu tip şeyleri sık sık yapıyorlar. Google DeepMind'da araştırma başkan yardımcısı ve derin öğrenme lideri Oriol Vinyals, X'te yaptığı açıklamada "Videodaki tüm kullanıcı komutları ve çıktıları gerçektir ve kısa olması için kısaltılmıştır" diyor. Yani Google’a göre videoda gösterilen yetenekler gerçek, sadece bu kadar tepkisel değil. Öte yandan Vinyals, Gemini ile oluşturulan çok modlu kullanıcı deneyimlerinin neye benzeyebileceğini göstermek ve geliştiricilere ilham vermek için böyle bir video hazırladıklarını aktarıyor.
Google, Gemini’yi en gelişmiş yapay zeka modeli olarak niteliyor ve belki de gerçekten de öyledir. Şimdilik bunu bilemiyoruz, ancak en önemli şey bu modelin temel olarak “multimodal” olması. Yani fotoğraf, video, ses ve yazı gibi girdileri işleyebiliyor. ChatGPT ve diğerleri bunu eklentiler ile yapıyor, temel olarak gerçek çok modelli değiller. Bunların yanı sıra Gemini’nin gerçek potansiyelini anlamak için Google’ın küçük bir beta sürüm başlatması daha doğru olabilir. Bu sayede insanlar gerçek dünya koşullarında modeli zorlayabilir ve ne kadar güçlü olduğunu deneyimleyebilir.
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}