- OpenAI’ın son modeli metin komutlarını alıyor ve bunları birden fazla karakter, belirli hareket türleri ve daha fazlasını içeren karmaşık sahnelere dönüştürüyor.
- Model ayrıca hareketsiz bir görüntüye dayalı bir video oluşturabilir, mevcut bir videodaki eksik kareleri doldurabilir veya genişletebilir.
- Sora şu anda yalnızca modeli potansiyel zararlar ve riskler açısından değerlendiren “kırmızı ekip üyeleri” tarafından kullanılabiliyor. OpenAI ayrıca geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sunuyor.
OpenAI, Sora adını verdiği yeni bir video oluşturma modelini piyasaya sürüyor. Yapay zeka şirketi Sora’nın “metin talimatlarından gerçekçi ve yaratıcı sahneler yaratabildiğini” söylüyor. Metinden videoya modeli, kullanıcıların yazdıkları talimatlara dayanarak bir dakika uzunluğunda fotogerçekçi videolar oluşturmalarına olanak tanıyor.
OpenAI’ın tanıtım blog yazısına göre Sora, birden fazla karakter, belirli hareket türleri ve özne ile arka planın hassas ayrıntılarıyla karmaşık sahneler oluşturabiliyor. Şirket ayrıca modelin, nesnelerin fiziksel dünyada nasıl var olduğunu anlayabildiğini, sahne dekorlarını doğru bir şekilde yorumlayabildiğini ve canlı duyguları ifade eden etkileyici karakterler üretebildiğini belirtiyor.
Model ayrıca hareketsiz bir görüntüye dayalı bir video oluşturabilir, mevcut bir videodaki eksik kareleri doldurabilir veya genişletebilir. OpenAI’nin teknik raporda yer alan Sora tarafından oluşturulan demolar arasında çeşitli senaryolar yer alıyor. Birçoğunda bazı yapay zeka belirtileri var. Sora, 1080p’ye kadar videolar üretebiliyor ve farklı dillere karşı duyarlı. Verilen komutlar doğrultusunda bir dijital dünya veya video oyununu canlandırabiliyor. OpenAI, modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmekte zorlanabileceğini söylüyor ancak sonuçlar genel olarak oldukça etkileyici.
Birkaç yıl önce, modellerin kelimeleri görüntülere dönüştürme becerisinin ön saflarında Midjourney gibi metinden görüntüye oluşturucular yer alıyordu. Ancak son zamanlarda, video dikkat çekici bir hızla gelişmeye başladı. Runway ve Pika gibi şirketler kendi metin-video modellerini gösterdiler. Google’ın Lumiere’i de OpenAI’ın bu alandaki başlıca rakiplerinden biri olacak gibi görünüyor. Sora’ya benzer şekilde, Lumiere de kullanıcılara metinden videoya araçlar sunuyor ve hareketsiz bir görüntüden video oluşturmalarını sağlıyor.
Sora şu anda yalnızca modeli potansiyel zararlar ve riskler açısından değerlendiren “kırmızı ekip üyeleri” tarafından kullanılabiliyor. OpenAI ayrıca geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sunuyor. Mevcut modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle edemeyebileceği ve belirli neden-sonuç örneklerini doğru bir şekilde yorumlayamayabileceği belirtiliyor.
Bu ayın başlarında OpenAI, metin-görüntü aracı DALL-E 3’e filigran eklediğini duyurdu. Ancak bunların kolayca kaldırılabileceğini belirtti. OpenAI, diğer yapay zeka ürünleri gibi sahte ama fotogerçekçi yapay zeka videolarının gerçekle karıştırılmasının sonuçlarıyla mücadele etmek zorunda kalacak.
Derleyen: Esin Özcan