NVIDIA çok etkileyici bir model yayınladı. Bu model metni videoya dönüştürebiliyor. Ek bilgi işlem yükü göz önüne alındığında, özellikle uzun biçimli ve yüksek çözünürlüklü video üretimi, üstesinden gelinmesi en zor olanlardan biri olmuştur. Bu konuda da NVIDIA, hesaplama yükünü önemli ölçüde azaltan Latent Diffusion Modeli'ni çıkarttı.
Bu model "büyük ölçekli" bilgi işlem gücüne erişim olmadan ölçeklendirmeyi yürütebilmek için hesaplama maliyetini yeterince düşürüyor. Büyük ölçekli genel ve halka açık video veri setlerinin eksikliği nedeniyle, önceki difüzyon modelleri, istemden uzağa halüsinasyona sürüklenmeden önce yalnızca düşük çözünürlüklü ve kısa biçimli videolar üretebiliyordu.