Uzmanlar, Stable Diffusion gibi popüler AI görüntü oluşturucularının, sanat yaratmak için makine öğrenimi algoritmalarını kullanırken cinsiyet ve kültürel önyargıları aşmak konusunda başarısız olduğunu iddia etti.
Gizmodo, birçok text-to-image görüntü oluşturucu yapay zekânın makine öğrenimi modellerinin, görüntüleri nasıl ürettiğini etkileyebilecek stereotiplere dayanabileceğini belirtti.
Hugging Face’de yapay zekâ araştırmacısı olan Sasha Luccioni, text-to-image AI’ların neye eğilim gösterdiğini ortaya koyan bir araç geliştirdi. Örneğin, Stable Diffusion Explorer’a yazılan “hırslı CEO” ifadesinin sonuçları sadece erkeklerden oluşurken “destekleyici CEO” ifadesi hem erkekleri hem de kadınları içeren sonuçlar verdi.
Benzer şekilde, OpenAI tarafından oluşturulan DALL-E 2, “inşaatçı” komutu için erkekleri, “uçuş görevlisi” komutu içinse kadınları resmetme eğilimi gösterdi.
Birçok AI görüntü oluşturucu sadece birkaç kelimeyle çalışıyor ve makine öğrenimi yapıyor gibi görünüp bir resim ortaya koysa da arka planda gerçekleşen çok şey var. Örneğin Stable Diffusion, “görüntü barındırma ve sanat siteleri de dahil olmak üzere internetten alınan milyarlarca resim, fotoğraf ve daha fazlasını” barındıran LAION görüntü kümesini kullanıyor.
Çevrim içi mecradaki görüntü aramalarındaki ırksal ve kültürel önyargı, AI görüntü oluşturucularının artan popülaritesinden önce, uzun zamandır süregelen bir konu. Luccioni, LAION veri kümesi gibi sistemlerin, bir komut istemiyle ilgili görüntülerin %90’ını barındıracağını ve bunu görüntü oluşturmak için kullanacağını belirtiyor. Bunun anlamı, yapay zekâ görüntü oluşturucuları, sahip oldukları materyal göz önünde bulundurulduğunda var olanın dışında bir gelişim göstermekten henüz uzaklar.