Ekran kartı dünyasının dev ismi Nvidia, metni videoya dönüştüren yapay zekâ teknolojisiyle gündeme damgasını vurdu.
Yapay zekâ, bugünlerde teknoloji dünyasının en büyük gündem maddesi. Yeni nesil “üretken” sistemler, video ayağı da dahil olmak üzere hem teknik hem de görsel olarak yeni kapıların açılmasını sağlıyor.
Bu kapsamda aktif çalışmalar yürüten önemli aktörlerden biri olan Nvidia, Latent Diffusion Model (LDM) tabanlı sistemiyle metni videoya bugüne dek görmediğimiz kadar iyi bir şekilde dönüştürebiliyor.
Fotoğraf kısmında Midjourney gibi üretken yapay zekâ uygulamalarının sağladığı kaliteye henüz ulaşılmış değil ancak sunulan örnekler, geleceğe dair muazzam bir potansiyele ışık tutuyor.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2023 Konferansında görücüye çıkan LDM, çok sayıda fotoğraf ve videodan oluşan büyük veri tabanlarını işliyor. Bunların analizini yapan sistem, şu an için 1280×2048 piksel videolar oluşturma yeteneğine sahip. Hâlen üzerinde çalışılmaya devam edilecek olan teknoloji, elbette ilerleyen zamanlarda gerçek anlamda kullanıma sunulabilir ve video üretim prosesini kökünden değiştirebilir. Öyle ki yakın gelecekte yapay zekâ tarafından üretilen videoları ayırt etmek tümüyle imkânsız hâle gelebilir.
Derleyen: Nazlı Koyuncu