OpenAI, Video Yapay Zeka Modeli Sora’yı Tanıttı

Destek Olun: Dijitaliyidir'de yayımlanan reklamları engellemek için AdBlocker kullanmazsanız bize destek olmuş olursunuz. Ayrıca ekibimize destek olmak isterseniz Google aracılığı ile destek olabilirsiniz. Şimdiden teşekkürler.
Esin Özcan
Ekleyen Esin Özcan
4 dk okuma süresi
  • OpenAI’ın son modeli metin komutlarını alıyor ve bunları birden fazla karakter, belirli hareket türleri ve daha fazlasını içeren karmaşık sahnelere dönüştürüyor.
  • Model ayrıca hareketsiz bir görüntüye dayalı bir video oluşturabilir, mevcut bir videodaki eksik kareleri doldurabilir veya genişletebilir.
  • Sora şu anda yalnızca modeli potansiyel zararlar ve riskler açısından değerlendiren “kırmızı ekip üyeleri” tarafından kullanılabiliyor. OpenAI ayrıca geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sunuyor.

OpenAI, Sora adını verdiği yeni bir video oluşturma modelini piyasaya sürüyor. Yapay zeka şirketi Sora’nın “metin talimatlarından gerçekçi ve yaratıcı sahneler yaratabildiğini” söylüyor. Metinden videoya modeli, kullanıcıların yazdıkları talimatlara dayanarak bir dakika uzunluğunda fotogerçekçi videolar oluşturmalarına olanak tanıyor.

Komut istemi: Bir fincan kahvenin içinde seyrederken birbirleriyle savaşan iki korsan gemisinin fotogerçekçi yakın çekim videosu.

OpenAI’ın tanıtım blog yazısına göre Sora, birden fazla karakter, belirli hareket türleri ve özne ile arka planın hassas ayrıntılarıyla karmaşık sahneler oluşturabiliyor. Şirket ayrıca modelin, nesnelerin fiziksel dünyada nasıl var olduğunu anlayabildiğini, sahne dekorlarını doğru bir şekilde yorumlayabildiğini ve canlı duyguları ifade eden etkileyici karakterler üretebildiğini belirtiyor.

Model ayrıca hareketsiz bir görüntüye dayalı bir video oluşturabilir, mevcut bir videodaki eksik kareleri doldurabilir veya genişletebilir. OpenAI’nin teknik raporda yer alan Sora tarafından oluşturulan demolar arasında çeşitli senaryolar yer alıyor. Birçoğunda bazı yapay zeka belirtileri var. Sora, 1080p’ye kadar videolar üretebiliyor ve farklı dillere karşı duyarlı. Verilen komutlar doğrultusunda bir dijital dünya veya video oyununu canlandırabiliyor. OpenAI, modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle etmekte zorlanabileceğini söylüyor ancak sonuçlar genel olarak oldukça etkileyici.

Komut istemi: Güzel, karlı Tokyo şehri hareketli. Kamera kalabalık şehir caddesinde ilerliyor, güzel karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ediyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgarda uçuşuyor.

Birkaç yıl önce, modellerin kelimeleri görüntülere dönüştürme becerisinin ön saflarında Midjourney gibi metinden görüntüye oluşturucular yer alıyordu. Ancak son zamanlarda, video dikkat çekici bir hızla gelişmeye başladı. Runway ve Pika gibi şirketler kendi metin-video modellerini gösterdiler. Google’ın Lumiere’i de OpenAI’ın bu alandaki başlıca rakiplerinden biri olacak gibi görünüyor. Sora’ya benzer şekilde, Lumiere de kullanıcılara metinden videoya araçlar sunuyor ve hareketsiz bir görüntüden video oluşturmalarını sağlıyor.

Komut istemi: 60’lı yaşlarında kır saçlı, sakallı bir adamın aşırı yakın çekimi, Paris’te bir kafede otururken evrenin tarihi üzerine derin düşüncelere dalmış, kendisi çoğunlukla hareketsiz otururken gözleri ekranın dışında yürüyen insanlara odaklanmış, yün bir ceket ve düğmeli bir gömlek giymiş, Kahverengi bir bere ve gözlük takıyor ve çok profesörce bir görünümü var ve sonunda hayatın gizeminin cevabını bulmuş gibi ince bir kapalı ağız gülümsemesi sunuyor, ışıklandırma altın ışığı ve arka plandaki Paris sokakları ve şehri ile çok sinematik, alan derinliği, sinematik 35mm film.

Sora şu anda yalnızca modeli potansiyel zararlar ve riskler açısından değerlendiren “kırmızı ekip üyeleri” tarafından kullanılabiliyor. OpenAI ayrıca geri bildirim almak için bazı görsel sanatçılara, tasarımcılara ve film yapımcılarına da erişim sunuyor. Mevcut modelin karmaşık bir sahnenin fiziğini doğru bir şekilde simüle edemeyebileceği ve belirli neden-sonuç örneklerini doğru bir şekilde yorumlayamayabileceği belirtiliyor.

Bu ayın başlarında OpenAI, metin-görüntü aracı DALL-E 3’e filigran eklediğini duyurdu. Ancak bunların kolayca kaldırılabileceğini belirtti. OpenAI, diğer yapay zeka ürünleri gibi sahte ama fotogerçekçi yapay zeka videolarının gerçekle karıştırılmasının sonuçlarıyla mücadele etmek zorunda kalacak.

Derleyen: Esin Özcan

Loading

Bu içeriği paylaş
Follow:
Yeni Medya ve İletişim öğrencisi olarak dijital dünyayla insanın kesiştiği noktaları merak ediyor. Bunun için okuyor, kendini geliştiriyor ve o dünyadan besleniyor. Farklı mecraların ve farklı insanların bir arada olduğu dijitaliyidir'in bu yolda en doğru yer olduğunu düşünüyor. Esin’in dijitaliyidir için sloganı “Dijital, farklılıklarımızı yansıtabildiğimiz zaman iyidir.” oldu.
Yorum bırak, puan ver