Bilimsel dergi Patterns’ta yayımlanan bir çalışma, yapay zekâ görsel üreticilerinin zamanla yalnızca 12 baskın stile yöneldiğini ortaya koydu.
Detaylar haberimizde…

.Görsel Üretimde “Kulaktan Kulağa” Deneyi
Araştırmacılar, yapay zekânın görsel çeşitlilik üretme kapasitesini test etmek için ilginç bir yöntem kullandı. Deneyde, Stable Diffusion XL adlı görsel üretim modeli ile LLaVA isimli görsel betimleme modeli karşılıklı olarak çalıştırıldı. Süreç, “kulaktan kulağa” oyununun görsel bir versiyonu olarak tasarlandı.
Öncelikle Stable Diffusion XL’e kısa ama detaylı bir metin verildi. Bu metin, doğayla çevrili bir ortamda yalnız oturan bir kişinin, unutulmuş bir dilde yazılmış eski bir kitap bulmasını anlatıyordu. Model bu metinden bir görsel üretti. Ardından bu görsel LLaVA’ya sunuldu ve görüntüyü betimlemesi istendi. Ortaya çıkan betimleme tekrar Stable Diffusion’a verilerek yeni bir görsel oluşturuldu. Bu döngü tam 100 tur boyunca devam etti.
Özgünlük Kısa Sürede Kayboluyor

Deney ilerledikçe, ilk görselin özgünlüğü hızla ortadan kalktı. Araştırmacılar, bu durumu insanlarla oynanan kulaktan kulağa oyununa benzetti. Mesaj her aktarıldığında biraz daha değişiyor ve sonunda ilk hâlinden tamamen kopuyordu. Yapay zekânın da benzer şekilde, görseli yeniden üretirken orijinal içeriği kaybettiği gözlemlendi.
Ancak araştırmacıları asıl şaşırtan nokta, ortaya çıkan görsellerin büyük ölçüde birbirine benzemesi oldu. Bin farklı deney ve binlerce yineleme sonucunda, görsellerin neredeyse tamamının zamanla aynı estetik kalıplar etrafında toplandığı tespit edildi.
Sadece 12 Baskın Görsel Stil
Araştırmaya göre, yapay zekâ tarafından üretilen görseller eninde sonunda yalnızca 12 baskın görsel motiften birine evriliyor. Bu motifler arasında deniz fenerleri, şehirlerin gece manzaraları, resmi ve simetrik iç mekânlar, rustik mimari yapılar ve pastoral doğa sahneleri öne çıkıyor.
Araştırmacılar bu tekrar eden estetik anlayışı “görsel asansör müziği” olarak tanımlıyor. Yani göze hoş gelen, rahatsız etmeyen ama aynı zamanda sıradan ve unutulabilir görseller. Bu tür imgeler, araştırmacılar tarafından otel odalarında ya da kurumsal mekânlarda karşılaşılan, dekoratif ama ayırt edici özelliği sınırlı görsellere benzetiliyor.
Model Değişiyor, Sonuç Değişmiyor
Çalışma yalnızca tek bir yapay zekâ modeliyle sınırlı kalmadı. Araştırmacılar farklı görsel üretim ve betimleme modelleri kullandıklarında da benzer sonuçlara ulaştı. Deney 1.000 tura kadar uzatıldığında bile, yaklaşık 100. turdan sonra görsellerin aynı estetik merkez etrafında birleştiği görüldü.
İlerleyen turlarda küçük görsel varyasyonlar ortaya çıksa da bu farklılıkların da yine popüler ve tanıdık görsel kalıplardan beslendiği belirtildi. Yani çeşitlilik artıyor gibi görünse bile, temel estetik anlayış değişmiyor.
Yapay Zekânın Yaratıcılık Sınırı
Araştırmanın ortaya koyduğu sonuçlar, yapay zekânın yaratıcılığına dair önemli tartışmaları yeniden gündeme getiriyor. İnsanlar arasında oynanan kulaktan kulağa oyununda, bireysel algılar, kültürel farklılıklar ve kişisel deneyimler nedeniyle büyük çeşitlilik oluşur. Yapay zekâ ise bunun tersine, ne kadar sıra dışı bir komut verilirse verilsin, sonunda dar bir estetik havuza geri dönüyor.
Araştırmacılara göre bunun temel nedeni, yapay zekâ modellerinin insan üretimi görsellerle eğitilmesi. İnsanların fotoğraf çekerken ve görsel üretirken tercih ettiği estetik kalıplar, yapay zekâ tarafından da yeniden üretiliyor. Bu da gösteriyor ki, bir tarzı taklit etmek, özgün bir estetik anlayışı öğretmekten çok daha kolay.
Sonuç olarak çalışma, yapay zekânın teknik kapasitesinin yüksek olmasına rağmen, estetik yaratıcılık konusunda hâlâ sınırlı olduğunu ortaya koyuyor. Bu bulgular, özellikle reklam, medya ve tasarım gibi alanlarda yapay zekâ kullanımının uzun vadeli etkilerinin daha dikkatli değerlendirilmesi gerektiğine işaret ediyor.


