Google, geçtiğimiz aralık ayında Gemini 1.0'ı, geçtiğimiz şubat ayında ise 1 milyon token bağlam penceresine sahip ilk model olan Gemini 1.5 Pro'yu yayınladı. Bunların yanında firma, Gemini modellerini oluşturmak için kullanılan aynı teknolojiden inşa edilen hafif açık model ailesi Gemma’yı da piyasaya sürmüştü. Şimdi ise Gemini ve Gemma daha da iyi hale geliyor. Gemini 1.5 Pro güncellenirken, yeni Gemini 1.5 Flash ve Gemini Live çıkıyor. Ayrıca iki yeni Gemma modeli ekleniyor.
Kısaca özetlersek Gemini 1.5 Pro, çeviri, kodlama, muhakeme ve daha fazlası gibi temel kullanım durumlarında kalite odaklı iyileştirmeler alıyor. Daha küçük Gemini modeli olan Gemini 1.5 Flash ise daha hızlı ve daha tepkisel. Her iki model de bugün 200'den fazla ülke ve bölgede önizlemede mevcut durumda ve Haziran ayında genel kullanıma sunulacaklar.
Fiyat noktasında Gemini 1.5 Pro fiyatı, 1 milyon token başına 7 dolar ve 128K’ya kadar 1 milyon token başına 3,50 dolar ile ücretlendirilecek. Gemini 1.5 Flash fiyatı ise 128K’ya kadar 1 milyon token başına 0,35 dolar ile çok daha ucuz.
Gemini 1.5 Flash
Hız ve verimlilik için optimize edilen Gemini 1.5 Flash, özetleme, sohbet uygulamaları, resim ve video altyazıları, uzun belge ve tablolardan veri çıkarma ve daha pek çok alanda yüksek performans sergiliyor. Google, Gemini 1.5 Flash'ı Pro sürümünden daha hafif ve daha ucuz bir modele ihtiyaç duydukları için geliştirdiklerini belirtiyor.
Gemini 1.5 Flash, Google'ın cihazlarda yerel olarak çalışan en küçük modeli olan Gemini 1.5 Pro ile Gemini 1.5 Nano arasında yer alıyor. Gemini Pro'dan daha hafif olmasına rağmen, aynı derecede güçlü. Google, bunu bir tür “damıtma” adı verilen bir süreçle başardığını söylüyor. Dolayısıyla bu, Gemini 1.5 Flash'ın Pro'nun aynı çok modlu yeteneklerinin yanı sıra bir milyon token'lık uzun bağlam penceresine (bir AI modelinin bir kerede alabileceği veri miktarı) sahip olacağı anlamına geliyor.
Google, Gemini 1.5 Flash'ın 1.500 sayfalık bir belgeyi veya 30.000'den fazla satıra sahip bir kod tabanını tek seferde analiz edebileceğini söylüyor. Gemini 1.5 Flash (ya da bu modellerden herhangi biri) tüketiciler için tasarlanan modeller değil. Bunlar, Google’ın teknolojisini kullanarak kendi yapay zeka ürünlerini ve hizmetlerini oluşturan geliştiriciler için.
Gemini 1.5 Pro güncellemeleri
Gemini 1.5 Pro, 150'den fazla ülkede ve 35'ten fazla dilde Gemini Advanced abonelerine sunulacak. Popüler yapay zeka modeli, tüm yeni özelliklerin (ve eski özelliklerin) tek bir yerde bulunabileceği özel bir Gemini uygulamasına kavuşuyor. Google ayrıca yeni özelliklerin Gemini ile web üzerinde de çalışacağını, böylece yeni özellikleri nerede kullanırsanız kullanın deneyebileceğinizi söylüyor. Gemini 1.5 Pro, 1 milyon token'dan başlayan büyük ölçüde genişletilmiş bir bağlam penceresi de sahip.
Bu kadar uzun bir bağlam penceresi, Gemini Advanced'in toplam 1.500 sayfaya kadar birden fazla büyük belgeyi anlamlandırabileceği veya 100 e-postayı özetleyebileceği anlamına geliyor. Yakında bir saatlik video içeriğini veya 30.000 satırdan fazla kod tabanını işleyebilecek. 1 milyon token’lik bağlam penceresi zaten halihazırda sektördeki en büyük bağlam penceresi. Ancak Google, 2 milyon token bağlam penceresine sahip 1.5 Pro’yu da kullanıma alıyor. Ancak bunun için Google AI Studio'da veya Google Cloud müşterileri için Vertex AI'da bekleme kaydolmanız gerekiyor. 2 milyonlun bağlam penceresi ile aynı anda iki saatlik video, 22 saatlik ses, 60.000 satırdan fazla kod ya da 1,4 milyondan fazla kelime işlenebilecek.
Tüm bu bağlam pencerelerinden yararlanmak için Google Drive üzerinden veya doğrudan cihazınızdan Gemini Advanced'e yükleme yapılabilecek. Ve çok yakında Gemini Advanced bir veri analisti olarak hareket edecek, elektronik tablolar gibi yüklenen veri dosyalarından anında içgörüleri ortaya çıkaracak ve özel görselleştirmeler ve grafikler oluşturacak.
Gemini Live geliyor
Ayrıca GPT-4o ile rekabet edecek Gemini Live da geliyor. İster mesajlaşıyor ister konuşuyor olun, Gemini ile daha doğal bir şekilde etkileşim kurmanın yeni yolu Gemini Live olacak. Gemini ile konuşmayı daha sezgisel hale getirmek için yeni bir mobil konuşma deneyimi olan Live önümüzdeki aylarda kullanıma sunulacak. Bu özellik Gemini Advanced aboneleri için olacak.
GPT-4o’da olduğu gibi Gemini Live’ın da sözünü kesebilecek ve yönlendirmeler yapılabilecek. Konuşma da çok daha insansı bir şekilde yürütülecek. Örneğin diyelim ki bir iş görüşmesine hazırlanıyorsunuz. Gemini Live sizinle birlikte prova yapabilir ve hatta potansiyel işvereninizle konuşurken vurgulamanız gereken beceriler önerebilir. Yılın ilerleyen dönemlerinde ise Live’a kamera ile görme özelliği de eklenecek.
Gemini Gems
Daha da kişisel bir deneyim için Gemini Advanced aboneleri yakında Gemini'nin özelleştirilmiş versiyonları olan Gems'i oluşturabilecekler. Spor salonu arkadaşı, aşçı yardımcısı, kodlama ortağı veya yaratıcı yazma rehberi gibi hayal ettiğiniz herhangi bir Gemiyi yaratmak mümkün olacak.
Üstelik bunu yapmak çok kolay olacak: "Sen benim koşu koçumsun, bana günlük bir koşu planı ver ve pozitif, neşeli ve motive edici ol" gibi. Gemini bu talimatları alacak ve tek bir tıklamayla bunları geliştirerek özel ihtiyaçlarınızı karşılayan bir Gem oluşturacak.
Gemma 2
Standart Gemma modelleri şu ana kadar yalnızca 2 milyar parametreli ve 7 milyar parametreli versiyonlarda mevcuttu ve bu da 27 milyarlık yeni modeli oldukça büyük bir adım haline getiriyor. Google'ın 27 milyarlık modeli Nvidia'nın yeni nesil GPU'larında, tek bir Google Cloud TPU ana bilgisayarında ve Vertex AI hizmetinde çalışacak şekilde optimize ettiğini vurguladı.
Kaynakça https://developers.googleblog.com/en/gemini-15-pro-now-available-in-180-countries-with-native-audio-understanding-system-instructions-json-mode-and-more/ https://deepmind.google/technologies/gemini/flash/ https://blog.google/technology/developers/gemini-gemma-developer-updates-may-2024/ https://blog.google/products/gemini/google-gemini-update-may-2024/ https://developers.googleblog.com/en/gemma-family-and-toolkit-expansion-io-2024/ Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Bana çok korkutucu geliyor bunlar.