Optik illüzyonların sıradan gözlemlerden çok daha fazlası olduğunu, yapay zekânın bu algı oyunlarını çözerken hem insan hem de makine görme sistemleri arasındaki derin bağları ortaya çıkardığını gösteren yeni araştırmalar, optik yanılgılara bakışımızı kökten değiştiriyor.
Detaylar haberimizde…
Gözlerimiz sık sık bizi yanıltabilir, ancak bilim insanları bazı yapay zekâların da aynı yanılsamalara kapılabileceğini keşfetti. Ve bu, beynimiz hakkında bildiklerimizi değiştiriyor.
Ay’a baktığımızda, ufka yakınken gökyüzünde daha yüksekte olduğundan daha büyük görünür, oysa boyutu ve Dünya ile Ay arasındaki mesafe gece boyunca hemen hemen aynı kalır.
Bu tür optik yanılsamalar, gerçekliği her zaman olması gerektiği gibi algılamadığımızı gösteriyor. Bunlar genellikle görsel sistemimizin yaptığı hatalar olarak kabul edilir. Ancak yanılsamalar aynı zamanda beynimizin çevremizdeki en önemli ayrıntıları çıkarmak için kullandığı zekice kısayolları da ortaya koyuyor.

Gerçekte, beynimiz çevremizdeki dünyadan sadece bir yudum alır – yoğun görsel ortamlarımızın her ayrıntısını işlemek çok fazla olurdu, bu yüzden bunun yerine sadece ihtiyacımız olan ayrıntıları seçer.
Peki, yapay zekâ ile çalışan bir makine görüş sistemi olan sentetik bir zihne optik bir yanılsama verdiğinizde ne olur? Bu sistemler ayrıntı konusunda mükemmel. Bunlar, bizim göremediğimiz kalıpları ve kusurları tespit etmek için tasarlandı. Bu nedenle, örneğin tıbbi taramalarda hastalıkların erken belirtilerini tespit etmede çok etkili oldular.
Ancak, günümüzün gelişmiş yapay zekâ algoritmalarının çoğunun temelini oluşturan teknoloji olan bazı derin sinir ağları (DNN’ler), biz insanlar gibi bazı görsel yanılgılara karşı hassas. Ve bu, kendi beyinlerimizin nasıl çalıştığına dair yeni bilgiler sağlıyor.
Japonya’daki Ulusal Temel Biyoloji Enstitüsü’nde nörofizyoloji doçenti olan Eiji Watanabe, “İllüzyon araştırmalarında DNN’leri kullanmak, beynin bilgiyi nasıl işlediğini ve illüzyonları nasıl ürettiğini simüle etmemize ve analiz etmemize olanak tanıyor. İnsan beyni üzerinde deneysel manipülasyonlar yapmak ciddi etik endişeler doğururken, yapay modeller için böyle bir kısıtlama söz konusu değil.” diyor.
Şimdiye kadar, insanların yaşadığı tüm illüzyonları deneyimleyebilen bir derin sinir ağı yok. Farklı optik illüzyonları neden algıladığımıza dair birçok teori olmasına rağmen, çoğu durumda hala kesin bir açıklama yok.
Optik illüzyonları deneyimlemeyen insanları incelemek bazı ipuçları sağladı. Bir örnekte, küçük yaşta görme yetisini kaybeden ve 40’lı yaşlarında görme yetisini geri kazanan bir kişi, dört stratejik olarak yerleştirilmiş dairesel parçanın kareyi andıran yanıltıcı konturlar oluşturduğu ünlü Kanizsa karesi gibi şekillerle ilgili yanılsamalara kanmadı. Ancak, berber direği gibi hareket yanılsamalarını algılayabiliyordu; burada çizgiler, direk dikey bir eksen üzerinde dönmesine rağmen yukarı doğru hareket ediyormuş gibi görünüyordu.
Bu tür vakalar üzerine yapılan çalışmalar, hareket algılama yeteneğimizin, şekilleri anlamlandırmaya kıyasla duyusal yoksunluğa karşı daha dirençli olduğunu göstermektedir. Bunun nedeni, bebeklik döneminde hareket işlemeyi daha erken öğrenmemiz olabilir. Alternatif olarak, şekilleri işleme biçimimiz daha esnek olabilir ve en çok maruz kaldığımız şekilleri tanımaya daha yatkın olabilir.

Fonksiyonel manyetik rezonans görüntüleme (fMRI) kullanan beyin görüntüleme çalışmaları da, farklı illüzyonları gördüğümüzde beynin hangi bölümlerinin aktif olduğunu ve bunların nasıl etkileşimde bulunduğunu anlamamıza yardımcı oldu. Bununla birlikte, optik illüzyon algımız özneldir ve bireyler arasında farklılık gösterebilir; örneğin, 2015 yılında internette viral olan çizgili bir elbise fotoğrafında, izleyiciler elbisenin mavi ve siyah mı yoksa beyaz ve altın mı olduğu konusunda hemfikir olamamışlar. Bu durum, araştırmacıların genellikle katılımcıların gördüklerini tanımlamalarına bağlı olmaları nedeniyle, illüzyonları objektif olarak incelemeyi zorlaştırmakta.
Optik Yanılgılar Artık Sadece Gözümüzü Değil, Algı Anlayışımızı da Test Ediyor
Şimdi ise yapay zeka, optik illüzyonlara baktığımızda beynimizde neler olup bittiğini anlamanın yeni bir yolunu sunuyor.
Günümüzde kullanılan birçok yapay zeka algoritması – ChatGPT gibi sohbet botları da dahil olmak üzere – beynimizin bilgiyi nasıl işlediğini taklit etmeye çalışan yapay nöronlardan oluşan modeller olan derin sinir ağları tarafından desteklenmekte.
Son çalışmalarında Watanabe ve meslektaşları, dönen yılan illüzyonu gibi hareket içeren illüzyonlara baktığımızda kendi beynimizde neler olduğunu derin bir sinir ağının taklit edip edemeyeceğini görmek istediler. Bu illüzyon, statik bir görüntüde renkli dairelerden oluşan tuhaf bir desen kullanır, ancak ona baktığımızda dönüyormuş gibi görünür.
Watanabe ve ekibi, beynimizin görsel bilgileri nasıl işlediğine dair önde gelen bir teori olan öngörücü kodlamaya dayalı olarak tasarlanmış PredNet adlı derin bir sinir ağı kullandı. Bu teori, görsel sistemimizin etrafımıza baktığımızda çevremizdeki özellikleri pasif bir şekilde işlemediğini öne sürüyor. Bunun yerine, önce geçmiş deneyimlerden yararlanarak ne görmeyi beklediğini tahmin ediyor ve ardından gözlerimizden gelen girdideki tutarsızlıkları işliyor. Bu da daha hızlı görmemizi sağlıyor.

Benzer şekilde, PredNet, daha önce gördüğü karelerden edindiği bilgilere dayanarak bir videodaki gelecekteki kareleri tahmin ediyor. Deney için Watanabe, yapay zekayı, insanların etrafa bakarken görebileceklerine benzer, başa takılan kameralarla çekilmiş doğal manzaraların videolarını kullanarak eğitti. Sistem hiçbir zaman optik illüzyonlara maruz bırakılmadı. Daha önce görmediği belirli kareler gösterilerek, tahmininin kareyle mümkün olduğunca eşleşmesi sağlandı.
“Yaklaşık bir milyon kareyi işledikten sonra, PredNet görsel dünyanın belirli kurallarını öğreniyor. “Temel kuralları çıkarıyor ve hatırlıyor ve bunlar arasında hareket eden nesnelerin özelliklerini de öğrenmiş olabilir.” diyor Watanabe.
Watanabe daha sonra yapay zekâ modeline dönen yılanlar illüzyonunun birkaç varyasyonunu ve insan beyninin aldanmadığı, dolayısıyla statik olarak algıladığı değiştirilmiş bir versiyonunu sundu. Yapay zekânın da insanlar gibi aynı görüntüler tarafından kandırıldığını buldu. Watanabe, bunun beynimizin tahmine dayalı kodlama kullandığı teorisini desteklediğini düşünüyor. Bu durumda, görüntülerin hareket eden nesneleri gösteren yönleri, beynimizin tahmin sistemini tetikleyerek çok renkli yılanların hareket halinde olduğunu varsaymasına neden oluyor.
Ancak Watanabe ve ekibi, yapay zekanın ve insanların illüzyonu algılama biçimleri arasında farklılıklar da buldu. Örneğin, dönen dairelerden birine odaklandığımızda, diğer diskler çevresel görüş alanımızda dönmeye devam ederken, o dairenin dönmesi durmuş gibi görünüyor. Ancak PredNet, her zaman tüm dairelerin aynı anda hareket ettiğini algılıyor.
“Bu muhtemelen PredNet’in dikkat mekanizmasının olmamasından kaynaklanıyor,” diyor Watanabe. Bu, görüntünün belirli bir noktasına odaklanamadığı, ancak görüntüyü bütünüyle işlediği anlamına geliyor.
Yapay zeka sistemleri ve robotlar görsel sistemimizin bazı yönlerini taklit edebilseler de, dünyayı bizim gibi görebilmekten hala çok uzaktalar. Watanabe, şu ana kadar insanların yaşadığı tüm illüzyonları deneyimleyebilen derin bir sinir ağı olmadığını söylüyor.
Bazı araştırmacılar, insanların belirli yanılsamaları nasıl algıladığını daha iyi simüle etmek için yapay zekayı kuantum mekaniğinin tuhaflığıyla birleştirmeye çalışıyor.
Daha önce araştırmacılar, bir küpün rastgele iki farklı yönelim arasında geçiş yaptığı ünlü bir belirsiz şekil yanılsaması olan Necker küpünün algılanışını açıklamak için kuantum mekaniğinden kavramlar kullandılar.
Klasik fizik teorileri, küpün bir şekilde veya diğer şekilde algılanması gerektiğini öngörürdü. Ancak kuantum mekaniğinde, beynimiz birini algılamayı seçene kadar küp aynı anda iki durumda olabilir. Schrödinger’in kedisi düşünce deneyini düşünün; bir kutuya hapsedilmiş ve onu öldürebilecek bir mekanizmaya sahip bir kedi, biri içeri bakana kadar hem ölü hem de canlıdır.
Bu çalışmadan ilham alan Avustralya’nın Bathurst kentindeki Charles Sturt Üniversitesi Yapay Zeka ve Siber Gelecekler Enstitüsü’nde araştırma görevlisi olan Ivan Maksymov, Necker küpünü ve benzer bir illüzyon olan Rubin vazosunu algılama biçimimizi simüle edip edemeyeceğini görmek için kuantum fiziğini yapay zeka ile birleştiren bir model geliştirdi. Kuantum tünelleme adı verilen bir olguyu kullanarak bilgiyi işleyen derin bir sinir ağı tasarladı. Sistem daha sonra iki illüzyonu tanımak üzere eğitildi.
İllüzyonlardan biri sisteme girildiğinde, iki yorumdan birini üretiyordu. Maksymov, yapay zekanın zaman içinde düzenli olarak ikisi arasında geçiş yaptığını -tıpkı insanlar gibi- buldu. Bu geçişlerin zaman aralıkları da benzerdi.
“İnsanların testlerde gördüklerine oldukça yakın,” diyor.
Maksymov, bunun beynimizin kuantum özelliklerine sahip olduğunu gösterdiğini düşünmüyor, ancak aktif bir araştırma alanı olduğunu belirtiyor. Bunun yerine, kuantum teorisi kullanılarak, yani kuantum biliş adı verilen bir alanın temeli kullanılarak, insan düşüncesinin bazı yönlerinin, örneğin nasıl karar verdiğimiz gibi, daha iyi modellenebileceğini gösterdiğini düşünüyor. Örneğin, illüzyonlarda beynimiz bir versiyonu veya diğerini seçiyor.
Böyle bir sistem, farklı yerçekimi koşulları altında uzayda görsel algımızın nasıl değişebileceğini simüle etmek için de kullanılabilir. Araştırmacılar daha önce Uluslararası Uzay İstasyonu’nda (ISS) zaman geçiren astronotların optik illüzyonları görme biçimlerinde meydana gelen değişiklikleri incelediler.
Astronotların, Dünya’dayken Necker Küpü gibi illüzyonları iki perspektifinden birinde daha sık gördüklerini buldular. Ancak yörüngede üç ay geçirdikten sonra, her bir perspektifi eşit sıklıkta gördüler. Bilim insanları bunun, derinliği nasıl değerlendirdiğimizin bir kısmının yerçekimine bağlı olmasından kaynaklanabileceğine inanıyor. Yörüngede serbestçe yüzerken, bir astronot otururken veya ayakta dururken gözlerinin yerden ne kadar yüksekte olduğuna bağlı olarak mesafeyi tahmin edemez.
Derleyen: Damla Şayan













.





.








