![OpenAI’dan CriticGPT: GPT-4'ün hatalarını GPT-4 bulacak](https://www.donanimhaber.com/images/images/haber/178921/src/openai-dan-criticgpt-gpt-4-un-hatalarini-gpt-4-bulacak178921_0.jpg)
OpenAI, ChatGPT tarafından oluşturulan programlama kodunu inceleyen insan eğitmenlere yardımcı olmak için CriticGPT'yi geliştirdiklerini söylüyor. Firma, ChatGPT kodunu gözden geçirmek için CriticGPT'den yardım alan insanların, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini belirtiyor.
GPT-4'ün hataları GPT-4'e emanet
![OpenAI’dan CriticGPT: GPT-4'ün hatalarını GPT-4 bulacak](https://www.donanimhaber.com/images/images/haber/178921/src/openai-dan-criticgpt-gpt-4-un-hatalarini-gpt-4-bulacak178921_1.jpg)
![OpenAI’dan CriticGPT: GPT-4'ün hatalarını GPT-4 bulacak](https://www.donanimhaber.com/images/images/haber/178921/src/openai-dan-criticgpt-gpt-4-un-hatalarini-gpt-4-bulacak178921_2.jpg)
![OpenAI’dan CriticGPT: GPT-4'ün hatalarını GPT-4 bulacak](https://www.donanimhaber.com/images/images/haber/178921/src/openai-dan-criticgpt-gpt-4-un-hatalarini-gpt-4-bulacak178921_3.jpg)
OpenAI aynı zamanda Force Sampling Beam Search (FSBS) adını verdikleri yeni bir teknik de geliştirdi. Bu yöntem en basit haliyle CriticGPT'nin daha ayrıntılı kod incelemeleri yazmasına yardımcı oluyor. Araştırmacılar FSBS ile CriticGPT'nin sorunları ararken ne kadar kapsamlı olacağını ayarlayabiliyor, aynı zamanda gerçekte var olmayan sorunları ne sıklıkla uydurabileceğini de kontrol edebiliyor.
İlginç bir bulgu da var
OpenAI, kod üzerindeki deneylere ek olarak, LLM eleştirmenlerinin genel yardımcı görevlerde nasıl performans gösterdiğini de araştırdı ve ilginç bir şekilde CriticGPT'nin yeteneklerinin kodun ötesine geçtiğini keşfetti. OpenAI, daha önce insanlar tarafından kusursuz olarak değerlendirilen ChatGPT eğitim verilerinin bir alt kümesinde CriticGPT'yi test etti. İlginç bir şekilde CriticGPT, buradaki vakaların yüzde 24’ünde hatalar buldu. OpenAI, bunun CriticGPT'nin kod dışı görevlere genelleme potansiyelini gösterdiğini ve dikkatli insan değerlendirmesinin bile gözden kaçırabileceği ince hataları yakalama yeteneğini vurguladığını düşünüyor.
CriticGPT mükemmel değil
En nihayetinde CriticGPT modeli de GPT-4 üzerinde inşa edilmiş bir yapay zeka. Bu nedende diğer tüm modeller gibi CriticGPT’nin de bazı sınırlamaları bulunuyor. Bu sınırlamaların başında modelin halen halüsinasyon görmesi geliyor. CriticGPT daha dar ve kaliteli bir veri kümesinde eğitilse de modellerin en doğal çalışma prensipleri nedeniyle daha az yapıyor olsa bile halüsinasyonlardan kurtulamıyor. Haliyle bunlar da insanların yanlış etiketlemeler yapmasına neden oluyor. Eğer bu konuda daha fazla bilgi almak istiyorsanız aşağıdaki içeriğimizi mutlaka okuyunuz:
Bununla birlikte CriticGPT, oldukça kısa olan ChatGPT cevapları üzerinde eğitildi. Bu da uzun ve karmaşık görevleri değerlendirmede performansını düşürüyor. Ayrıca bazen hatalar tek bir yerde olmayabiliyor. CriticGPT, belirli bir yerde tespit edilebilen hataları belirlemede oldukça iyi olsa da gerçek dünyadaki hatalar bir cevabın birçok bölümünde olabiliyor. Ek olarak OpenAI, CriticGPT’nin bir yere kadar yardımcı olabileceğini söylüyor. Bir görev veya yanıt son derece karmaşıksa, model yardımı alan bir uzman bile bunu doğru bir şekilde değerlendiremeyebilir.
Kaynakça https://www.businesstoday.in/technology/news/story/openai-introduces-criticgpt-an-ai-tool-that-helps-coders-identify-bugs-and-improve-code-quality-434987-2024-06-28 https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/ https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
![DH Android Uygulamasını İndir](/Content/img/uygulama-indir-android.png)
![DH iOS Uygulamasını İndir](/Content/img/uygulama-indir-ios.png)
https://t.me/pandastic_bot?start=REFTRZ1954 Bedava Dolar Kazan Binance onaylı
Efsane Türkiye’ye gelse alırım..
O ışık efektleri sadece yanlarda değil üstte de olmalıydı. Böylece tabancayı kullanan, kafasını yana eğmek zorunda kalıp, fıtık olmaz.
Mukemmel bir silah acaba ne kadar hızlı atıyor. [resim] [resim]
Fiyat makul olsa efsane olur gerçekten ya.
Vay bee, bu cihaz xiaomi çıktı ben de diyordum kim üretmiş..
hocam 4x daha iyi direk hs attirir
Über
Evet ama 6x scop daha iyi gider buna daha uzaktaki hedefler için. Gerektiğinde 3x'e de çekebilirsin falan :D
Muskun alev tabancası vs bu
İstilacı güvercinlere karşı iyi olur. 5 10 dk da bir sopayı alıp kovalamak yordu artık.
Yakında su atan F18 falanda yaparlar :)
Hazneye kezzaplı su doldurup nişan almak yapmayın böyle şeyler yahu...
Xiaomi kendini çok geliştirdi artık her alanda kaliteli işler yapıyorlar.
fışkırttığı su mermi gibi isabetli gitmeyeceği için gereksiz diye düşünmüş olabilirler.
Lazer nişangah da eklenseymiş tadından yenmezmiş.