Yapay zeka, insanları çoğu performans testinde geride bıraktı

Stanford Üniversitesi'nin AI endeksi raporunda, yapay zekanın hızlı gelişimi ele alındı. Yapay zeka birçok parametrede insanları geride bırakmayı başardı.

Karmaşık akıl yürütmede büyük gelişme yaşandı
Doğruluk konusunda da büyük ilerleme kaydedildi
Midjourney'in resim oluşturmadaki gelişimi

Yapay Zeka

Deniz Çakmak

Haber Editörü

Bildirimi Aç Bildirim Açık

Yapay zeka, insanları çoğu performans testinde geride bıraktı — Stanford Üniversitesi İnsan Merkezli Yapay Zeka Enstitüsü (HAI), akademik ve endüstriyel uzmanlardan oluşan bir ekip tarafından yazılan **AI Endeksi** raporunun yedinci yıllık sayısını yayınladı.

Oldukça geniş içerikli olan raporun en dikkat çekici kısmı yapay zekanın insanlarla karşılaştırıldığında gösterdiği performans. Baş döndürücü hızla gelişen yapay zeka halihazrıda birçok alanda insanı geride bırakmış durumda. Yapay zeka, 2015 yılında görüntü sınıflandırma, 2017'de temel okuduğunu anlama, 2020'de görsel muhakeme ve 2021 yılında doğal dil çıkarımı alanlarında insanları geride bırakmayı başardı.

Yapay zeka o kadar akıllı ve hızlı bir hale geliyor ki, şuana kadar kullanılan kriterlerin çoğu artık geçerliliğini yitirmiş durumda. Dolayısıyla araştırmacılar yeni ve daha zorlu ölçütler geliştirmek için uğraşıyor. Bu testler sadece yapay zekanın yeterliliğini ölçmek için değil, insanlarla yapay zekaların farklılıklarını vurgulamak ve hangi alanlarda insanların avantajlı olduğunu belirlemek için geliştiriliyor.

Aşağıdaki sonuçların bu eski, muhtemelen geçerliliğini yitirmiş ölçütlerle yapılan testleri yansıttığını belirtmekte fayda var. Ancak genel eğilim hala çok açık:

Karmaşık akıl yürütmede büyük gelişme yaşandı

Yeni AI Index raporu, 2023 yılında yapay zekanın ileri düzey matematik problemleri çözme ve görsel sağduyulu akıl yürütme gibi karmaşık bilişsel görevlerle hâlâ sıkıntı yaşadığını gösteriyor. Ancak bu alanlarda bile kötü performans gösterdiğini söyleyemeyiz.

12500 adet zorlu yarışma düzeyindeki matematik probleminden oluşan bir veri kümesi olan MATH üzerindeki yapay performansları, piyasaya sürülmesinden bu yana geçen iki yıl içinde önemli ölçüde arttı. 2021'de yapay zeka sistemleri problemlerin yalnızca %6,9'unu çözebiliyordu. 2023'te ise GPT-4 tabanlı bir model soruların %84,3'ünü çözmeyi başardı. İnsan ortalaması %90 düzeyinde.

Diğer bir alan ise görsel sağduyu muhakemesi (VCR). VCR, basit nesne tanımanın ötesinde, yapay zekanın tahminlerde bulunmak için görsel bağlamda yer alan bilgiyi nasıl kullandığını değerlendiriyor. Örneğin, masanın üzerindeki bir kedinin resmi gösterildiğinde, VCR'li bir yapay zeka, kedinin masadan atlayabileceğini veya ağırlığı göz önüne alındığında masanın onu taşıyacak kadar sağlam olduğunu tahmin etmesi gerekiyor.

Raporda, 2022 ile 2023 yılları arasında VCR'de %7,93'lük bir artışla 81,60'a (insan ortalaması 85) ulaştığı belirtiliyor.

Doğruluk konusunda da büyük ilerleme kaydedildi

Günümüzde yapay zeka birçok meslekte yazılı içerik üretiyor. Ancak, büyük ilerlemelere rağmen, büyük dil modelleri (LLM) hala "halüsinasyonlara" eğilimliler. Buradaki halüsinasyon terimi yanlış veya hatalı bilgiler üretmesi anlamına geliyor.

Yeni AI Index raporunda TruthfulQA, LLM'lerin doğruluğunu test etmek için bir kıyaslama olarak kullanıldı. 817 adet soru (sağlık, hukuk, finans ve politika gibi konularla ilgili), insanların sıklıkla yanlış anladığı yaygın yanlış kanılara meydan okumak için tasarlandı.

2024'ün başlarında piyasaya sürülen GPT-4, 0,59 puanla kıyaslamada en yüksek performansı elde etti. Bu skor, 2021'de test edilen GPT-2 tabanlı modelden neredeyse üç kat daha yüksek. Dolayısıyla büyük dil modellerinin giderek daha iyi eğitildiği ve daha doğru cevaplar vermeye başladığı görülüyor.

Midjourney'in resim oluşturmadaki gelişimi

Peki ya yapay zeka tarafından oluşturulan görüntüler? Buradaki gelişmeyi görmek için Midjourney'in 2022'den bu yana Harry Potter'ın gerçekçi resmini nasıl oluşturduğuna bakabilirsiniz. İki senede geldiği nokta etkileyici.

Metinden Görüntüye Modellerin Bütünsel Değerlendirmesi (HEIM) kullanılarak büyük dil modelleri, görüntülerin gerçek dünyada kullanımı için önemli olan 12 temel hususta metinden görüntüye oluşturma yetenekleri açısından karşılaştırıldı. Oluşturulan görüntüler insanlar tarafından değerlendirdi ve hiçbir modelin tüm kriterlerde mükemmel olmadığı görüldü. Görüntünün giriş metniyle ne kadar iyi eşleştiği konusunda OpenAI'nin DALL-E 2'si en yüksek puanı aldı. Stable Diffusion temelli Dreamlike Photoreal modeli, kalite, estetik ve özgünlük açısından en yüksek sırada yer aldı.

2023 yılı boyunca yapay zekada görülen hızlı gelişme son sürat devam ediyor. Yeni geliştirilen modellerle beraber yapay zeka ile insan arasındaki uçurum kapanmış durumda. Bu hızlı gelişme, insanlarda güvenlik, güvenilirlik ve etik gibi konularda endişeler oluştursa da duracak gibi görünmüyor.

Kaynakça https://newatlas.com/technology/ai-index-report-global-impact/ https://hai.stanford.edu/news/ai-index-state-ai-13-charts

Yorum Yaz Paylaş Tweetle

Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:

Daha Fazla Video

Sessiz Video Tercihleri

Otomatik yükle ve oynat

Video bitince sonrakine geç

donanimhabercom Instagram Takip Et

Bayraktar TB3, gemide 100 sortiyi tamamladı

hexedemical 32 dakika önce

Bu ne 2001 de f16 üretiyoduk şimdi f35 modernizasyonu için abd onayını bekliyorlar, nerden nereye

YouRæk 17 saat önce

20 sene önce yerli ve milli tüfek bile üretemeyen ülkeden bugün dünyanın konuştuğu savunma sanayi projelerini gerçekleştiren ülkeye. Hamdolsun.

Forumdan Konular

Editörün Seçtiği Sıcak Fırsatlar

{{Title}}

{{Description}}
{{Price}} {{PriceUnit}} {{DiscountInformation}}

Sıcak Fırsatlar Forumunda Tıklananlar

adidas DURAMO SPEED W Spor AyakkabıKadın : Amazon.com.tr: Moda

https://www.amazon.com.tr/dp/B0CKXTFDJH
Samsung 55Q67D, 55 inç 139 Ekran, 50 Hz, QLED 4K Smart TV (2024), QE55Q67DAUXTK Titan Grey : Amazon.com.tr: Elektronik

https://www.amazon.com.tr/dp/B0CZTVV1YH
Samsung 55DU8500, 55 inç 139 Ekran, 50 Hz, 4K Crystal UHD Smart TV (2024), UE55DU8500UXTK : Amazon.com.tr: Elektronik

https://www.amazon.com.tr/dp/B0DBZPN8X8
Süvari Premium Svr Kapüşonlu Mont 001 Yeşil L Fiyatları ve Özellikleri

https://www.n11.com/urun/suvari-premium-svr-kapusonlu-mont-001-54037363?magaza=suvari
Exoprimal ürününü satın al | Xbox

https://www.xbox.com/tr-TR/games/store/exoprimal/9NMFRHJX5JCZ/0010/9R896325MTVF
Shell’de BOŞ YOK! | Kalitesiyle Güven Veren Shell Hep İleride

https://www.shell.com.tr/suruculer/shellden-avantajli-kampanyalar/shellde-bos-yok.html

Tavsiyelerimiz

Telefon Tavsiyesi Tümü

10.000-15.000 TL Arası Telefonlar

Oppo Reno11 FS

Bu Telefonu Satın Al

Notebook Tavsiyesi Tümü

20.000-30.000 TL Arası Laptoplar

ASUS TUF A15

Bu Notebook'u Satın Al

Sistem Tavsiyesi Tümü

Üst Seviye Sistem

Bu Sistemi Satın Al