OpenAI CTO'su Mira Murati, merakla beklenen canlı yayın etkinliğinde GPT-4o'nun metin, ses ve görüntüyü tek bir modelde işleyebildiğini paylaştı. GPT-4o çok daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adımdır; herhangi bir metin, ses, görüntü ve video kombinasyonunu girdi olarak kabul eder ve herhangi bir metin, ses ve görüntü kombinasyonunu oluşturur.