Google araştırma mühendisleri, kalabalık ortamlarda kaydedilen görsel ve işitsel verileri kullanarak sesleri ayrıştırabilen bir yapay zeka (AI) sistemi geliştirdi. Tasarlanan bu yeni teknoloji, insan beyninin kalabalık bir ortamdaki sesleri izole ederek, duymak istediği sese odaklanması mantığına dayanan "kokteyl partisi etkisi"ne dayanıyor.
Teknoloji hem video hem de ses verilerine ihtiyaç duyuyor
Google'ın bu yapay zekası, hem video, hem de ses verileriyle aynı anda çalışmak üzere tasarlanmış. Arama devinin, bu teknolojiyi oluşturmak için Youtube'da yer alan 100 binden fazla yüksek kaliteli videoyu kullandığı açıklanırken, yapay zekaya tüm konuşmaların minimum arka plan gürültüsü ve tek bir hoparlörden verildiği belirtiliyor.
Araştırmacılar, bir sonraki adımda ise yapay zekayı ileri seviyeye taşımak için, seslerin birbirinden ayrıştırılmasını zorlaştıracak dış konuşmaların sisteme eklendiğini açıklıyorlar. Sonucun ise oldukça başarılı olduğunu belirten yetkililer, kalabalık ortamdaki seslerin izole edilerek, odaklanılacak sesin ön plana çıkarılmasının tek şartının, konuşan kişinin yüzünün ekranda görülmesi olduğunu söylüyorlar. Google'ın bu sesleri ayrıştıran bu yapay zeka teknolojisini, bazı servislerine entegre etmeyi planladığı da gelen bilgiler arasında.
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Bana çok korkutucu geliyor bunlar.