Uygulama ile Aç

Yapay zeka hata ayıklamada hâlâ yazılımcıların çok gerisinde

Microsoft Research tarafından geliştirilen Debug-gym, yapay zekaların kod yazma ve hata ayıklama kabiliyetlerini test etti. Yapay zeka, hata ayıklamada hâlâ yazılımcıların çok gerisinde.

Yakın bir gelecekte pek çok sektörde iş imkânlarını epey kısıtlayacak olan yapay zeka, yazılımcılar açısından da ciddi bir risk teşkil ediyor. Bugün bile kod yazma konusunda etkileyici kabiliyetlere sahip olan yapay zekanın önümüzdeki birkaç yıl içinde pek çok görevi kendi başına yerine getirebileceğine inanılıyor. Bu yüzden pek çok şirketin yazılımcıların yerini AI ile doldurmasından korkuluyor. Hatta bunun ilk emeralerini şimdiddden görmeye başladık. Hatırlarsanız Mark Zuckerberg ocak ayında bir açıklama yaparak, Meta'daki kod yazma işlerinin bir kısmını bu yıl içinde AI'a devretmeye başlayacaklarını açıklamıştı.

Başta Meta olmak üzere Silikon Vadisi'nde pek çok şirket kod yazma konusunda AI'a gitgide daha çok güveniyor olsa da Microsoft tarafından paylaşılan son veriler, bu konuda biraz aceleci davranıldığını gösteriyor. Çünkü yapay zeka, özellikle hata ayıklama konusunda hâlâ yazılımcıların çok gerisinde.

Ayrıca bkz.

Yapay zeka dünyasında bu hafta: 13 Nisan 2025

Debug-gym, Yapay Zekanın Hata Ayıklama Kabiliyetlerini Test Ediyor

Microsoft Research, yapay zekanın kod yazma ve hata ayıklama konusunda ne durumda olduğunu görmek ve bu alanlarda daha da gelişmesini sağlamak için Debug-gym adını verdiği yeni bir araç geliştirdi. GitHub üzerinden kullanıma sunulan Debug-gym, AI modellerinin normalde programlarının parçası olmayan hata ayıklama araçlarını da kullanabildikleri bir platform sunuyor.

Microsoft tarafından paylaşılan sonuçlar, yapay zeka modellerinin Debug-gym'in kendilerine sunduğu bu araçları kullanırken bile hata ayıklamada o kadar iyi olmadığını gösteriyor. Debug-gym dışındaki performanları ise çok daha kötü.

Yukarıdaki grafikte de görüleceği Claude 3.7, OpenAI o1, OpenAI o3-mini gibi bugün kullanımda olan en güçlü yapay zekalardan bazıları bile kod yazma konusunda henüz istenen noktada değiller. Özellikle hata ayıklama araçlarını kullanmadıklarında. Debug-gym'in kendilerine sunduğu hata ayıklama araçlarını kullandıklarında performanslarında kayda değer bir artış yaşandığı görülüyor. Ama burada bile elde edilen en yüksek başarı oranı yüzde 48.4.

Yapay zekanın Debug-gym'de kendisine sunulan hata ayıklama araçlarını tam olarak nasıl kullanacağını bilmediği, çünkü bu konuda eğitilmediği vurgulanıyor. Yapay zeka bu alanda daha çok eğitilip, buna yönelik araçlarla donatıldıkça, başarı oranı da artacaktır. Nitekim Debug-gym'deki tam olarak anlamadığı araçları kullandıklarında bile performanslarında ciddi bir artış yaşandığı görülüyor. Zaten Microsoft Research de Debug-gym aracıyla yapay zekaların gelişimine katkıda bulunmayı hedefliyor.

Microsoft Research ekibi tarafından yazılan makalede, hata ayıklamaya özel olarak ayarlanmış bir modelin daha iyi sonuç verebileceğine dikkat çekiliyor. Bu noktada ortaya çıkan bir çözüm, bu büyük dil modellerine eşlik edecek daha küçük modeller geliştirmek olabilir. Tamamen bilgi toplama ve hata ayıklama odaklı bu küçük model, daha sonra bu bilgileri büyük modele aktararak çok daha iyi sonuçlar vermesini sağlayabilir. Ama en azından şimdilik, hata ayıklama konusunda yapay zekanın yazılımcılara alternatif olması gibi bir durum söz konusu değil. 



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
6 Yorumun Tamamını Gör