Anlık Bildirim

Bir şeyler uydurmak yapay zeka için Aşil’in topuğu olmaya devam ediyor

Üretken yapay zeka günümüzde bir şeyler üretmeden duramıyor ve firmalar da bu alanda yatırım yapmaktan çekinmiyor. Ancak yapay zekanın en önemli sorunu halen devam ediyor.
Yapay zeka için Aşil’in topuğu bir şeyler uydurmak Tam Boyutta Gör
Mitoloji ile yakın olan veya 2004 yapımı sinema filmi Truva’yı izleyenler Aşil tendonunun nereden geldiğine hakimdir. Bilmeyenler için hikayeyi kısaca özetlememiz gerekirse; Yunan mitolojisindeki büyük savaşçı Aşil, topuğundan tutularak annesi tarafından ölümsüzlük nehrine batırılır. Bu nedenle, Aşil'in topuğu onun vücudundaki tek zayıf noktası olarak kalır. En nihayetinde ise Truva Savaşı'nda Paris tarafından topuğundan vurularak öldürülür. "Aşil'in topuğu" veya "Aşil'in tendonu" gibi terimler de bir şeyin en zayıf noktası olarak kullanılıyor. Günümüzün en popüler başlığı olan yapay zekaların Aşil topuğu ise bir şeyleri uydurma sorunu olmaya devam ediyor.

Yapay zekanın zayıf karnı

Eğer ChatGPT, Gemini veya diğer sohbet robotlarını kullanmışsanız hiç de azımsanmayacak sıklıkta bu araçların bir şeyler uydurduğunu fark etmişsinizdir. Her ne kadar bunlara zeka diyor olsa da bu sistemler gerçek ve kurgu arasında ayrım yapamazlar. Bu nedenle yaptıkları uydurmaları bir gerçek olarak ifade etmeye meyillidirler.

Tüm bunlar 30 Kasım 2022’de ChatGPT piyasaya çıktığında öğrendiğimiz bir şeydi. Aradan 2 yıl geçmesine rağmen bu bilgiler tam olarak doğru olmaya devam ediyor. Geçtiğimiz yıl firmalar sunumlarında bunun gibi uydurma veya “halüsinasyon” görme eğilimlerine atıfta bulunuyordu. Ancak 2024’te firmalar sanki artık bu uydurma sorunu çözülmüşçesine en kritik alanlara bile üretken yapay zekayı entegre ediyorlar ve artık sorulmadığında halüsinasyon ile ilgili bir şeyler söylemiyorlar.

Yapay zeka için Aşil’in topuğu bir şeyler uydurmak Tam Boyutta Gör
Elbette sıradan bir kullanıcı ChatGPT veya Gemini’yi basit şeyler için kullanıyor. Açıkçası bu içeriğin yazarı bu sistemleri daha çok yemek tarifi için kullanıyor. Eğer tarif yanlış ise biraz zaman kaybı yaşanıyor ama ortada ciddi bir sorun olmuyor. Öte yandan bu teknoloji artık tıp, finans ve hukuk gibi alanlara yayılıyor. Bu alanlarda yapılacak bir hata için “Özür dilerim, yanlış bilgi verdim” demek yeterli olmayacaktır.

Geçtiğimiz günlerde popüler yapay zeka arama motoru Perplexity’nin Forbes ve Wired’a ait içerikleri izinsiz olarak özetlediği tespit edilmişti. Yapılan detaylı incelemelerde Perplexity’nin sunmuş olduğu özetlerde hataların olduğu keşfedildi. Yani bu sistemler ona sunduğunuz tek bir kaynağı özetlerken bile hata yapabiliyor. Perplexity konusuna daha önce değinmiştik anacak Wired, bu arama motorunu "saçmalık makinesi" olarak nitelendirmişti.

Benzer şekilde Google’ın yapay zeka destekli araması AI Overview’da da benzer şekilde hatalı sonuçlar gördük. Yapan oldu mu bilinmez ancak Google’ın yapay zekası insanlara taş yemelerini veya peyniri pizzaya tutturmak için yapıştırıcı kullanmalarını tavsiye etti.

Doğruluk, bir olasılıktan ibaret

ChatGPT’nin piyasaya sürülmesinden sonra bu sistemlerin doğruluğu üzerinde pek çok araştırma yaptı. Yapılan bilimsel araştırmalar bu sistemlerin doğruluğu ile ilgili ciddi endişeler ortaya koyuyor. Dediğimiz ve daha önce değindiğimiz gibi; yapay zekalarda herhangi bir zeka bulunmuyor. Bunlar en basit ifadeyle bir “olasılık robotu”. Dolayısıyla kendi başlarına doğrulukla ilgilenmiyorlar ve doğrulukla ilgili gerçek bir kaygı duymadan doğruya uygun görünen metinler üretmek üzere tasarlanmış durumdalar.

Bahsettiğimiz bir şeyleri uydurma, halüsinasyon görme gibi sorunlar ise esasında yapay zekalar nasıl çalışıyor? sorusunun bir cevabı. Bu sistemlerin ortaya koyduğu bu hatalar kendi başlarına basit bir hata değil bu, teknolojinin nasıl çalıştığının bir göstergesi. Daha ileri bir okuma için lütfen bir üstteki içeriğimize göz atınız.

Ancak kısaca özetlemek gerekirse; Gemini veya ChatGPT’ye güç veren büyük dil modelleri (LLM) her bir harften sonra gelecek harfi tahmin etmek üzere kurulmuş bir sistemden ibaret. Bunlar bilgiye dayalı olarak oluşmuyor, hatta kelimelere dayalı bile oluşturulmuyor. İşin içinde bir tahmin, bir olasılık olduğu için de hiçbir şirket modelin aynı soruya her zaman aynı yanıtı vereceğini asla garanti edemiyor.

Öte yandan bu teknolojiye yakın olmayan sıradan insanlar için yapay zeka, sorularını yanıtlayacak, hastalıklarını teşhis edecek ve/veya işlerini ellerinden bir teknoloji olmaya devam ediyor. Yapay zeka şirketleri -açıkça söylemeyi bırakmış olsalar da- doğruluk konusunu irdelemeye ve çözmeye çalışıyor. En basit ancak kesin olmayan çözümlerden birisi modelin boyutunu yani beslendiği veri kütüphanesini ve bu kütüphanenin kaliteli verilerden oluşmasını sağlamak. Milyonlar yerine artık milyar parametreli modellere geçişimiz de bunun bir göstergesi. Ancak en nihayetinden teknolojinin dayandığı şeyde sorun olduğu için çözüme ulaşmak zorlu bir yolculuk olacak.

Kaynakça https://www.forbes.com/sites/quickerbettertech/2023/06/23/on-technology-the-achilles-heel-of-ai-that-no-one-is-talking-about/ https://link.springer.com/article/10.1007/s10676-024-09775-5 https://www.aisnakeoil.com/p/chatgpt-is-a-bullshit-generator-but Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Önceki Haftalar
Tüm Zamanların En İyi Yorumcuları
ANLIK GÖRÜNTÜLEMELER
1 Kişi Okuyor (0 Üye, 1 Misafir) 1 Masaüstü

GENEL İSTATİSTİKLER
5347 kez okundu.
11 kişi, toplam 12 yorum yazdı.

HABERİN ETİKETLERİ
büyük dil modeli, chatgpt ve
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Sıcak Fırsatlar Forumunda Tıklananlar

Tavsiyelerimiz

Yeni Haber
şimdi
Geri Bildirim