Uygulama ile Aç

OpenAI binlerce saatlik veriyi kullanarak Minecraft botunu başarıyla eğitti

Yapay zeka araştırma şirketi OpenAI, makine öğrenimi alanında ilerleme kaydetmeye devam ediyor. Şirket son olarak binlerce saatlik veriyi kullanarak bir Minecraft botunu başarıyla eğittiğini duyurdu.

Minecraft, gelişmiş yapay zeka araştırmalarını destekleyebilecek seviyede bir araç gibi görünmeyebilir. Ancak OpenAI’in son araştırmaları yapay zeka ile iyi eğitilmiş bir Minecraft botunun insanlardan daha başarılı olabileceğini gösteriyor.

OpenAI yapay zekaya (AI) ve insanlığa fayda sağlayan makine öğrenimi ilerlemelerine odaklanan bir şirket konumunda. Son zamanlarda firma, 70.000 saatten fazla oyun videosu kullanarak bir botu Minecraft oynamak için başarıyla eğittiğini duyurdu. Başarı, oyun oynayan bir bottan çok daha fazlasını, gözlem ve taklit temelli makine öğreniminde ileriye doğru atılmış büyük bir adıma işaret ediyor.

Yapay zeka eğitimi için önemli gelişme

OpenAI’ın geliştirmiş olduğu botu, taklit edilmiş öğrenme ya da denetimli öğrenmenin mükemmele yakın bir örneği konumunda. Hedefe ulaşıldığında ödüllendirme vadeden pekiştirmeleri öğrenmenin aksine taklit edilmiş öğrenme, insanların belirli görevleri yerine getirmesini izleyerek gerçekleştiriliyor. Bu iki öğrenme taktiği biz insanlar için de geçerli. Bu durumda OpenAI, botlarına, tipik bir oyuncunun başarması için yaklaşık 24.000 bireysel eylem gerektirecek karmaşık oyun içi hamleleri öğretmek için mevcut oyun videolarından ve eğitimlerinden yararlandı.

Taklit edilmiş öğrenmenin en büyük eksiği yeterli veri kümesinin bulunup bulunmaması ve bu veri kümelerinin yeterli kalitede olup olmamasıdır. Öte yandan eğitim sırasındaki girdilerin bağlamı ve sonucunun ne olduğu etiketlenmelidir. Dolayısıyla bu yaklaşım biraz daha fazla emek istiyor ancak spesifik bir işte uzmanlaşmasını istediğimiz sistemler için bu alan oldukça önemli.

Ayrıca bkz.

Meta'nın yapay zekası insanları kandırarak oyunu kazanıyor

OpenAI ise yukarıda bahsettiğimiz manuel veri etiketleme işlemleriyle uğraşmak yerine mevcut etiketli videoların sayısını artırmak için Video Ön Eğitimi (VPT) olarak bilinen özel bir yaklaşım kullandı. Başlangıçta 2000 saatlik açıklamalı Minecraft oynanışıyla sistem eğitildi. Ardından bu işlemde elde edilen veriler 70.000 saatlik daha önce etiketlenmemiş Minecraft içeriğini etiketlemek için kullanıldı. Dolayısıyla bu işlem sonucunda Minecraft botuna incelemesi ve taklit etmesi için çok daha büyük bir veri kümesi sağladı.



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş