Facebook, Ray-Ban ile kendi AR gözlüklerini oluşturmak da dahil olmak üzere artırılmış gerçekliğe çok fazla zaman ve para harcamaya başladı. Şu anda bu cihazlar yalnızca görüntüleri kaydedebilir ve paylaşabilir durumda, ancak şirket bu tür cihazları gelecekte ne için kullanılacak?
Bir yeni bir araştırma projesi aslında AI (Yapay Zeka) ekibi tarafından yönetilen şirketin amaçları ve vizyonu konusunda bize bazı fikirler vermekte. Facebook, birinci şahıslar tarafından çekilen kişisel videoları kullanarak insanların hayatlarını sürekli analiz eden AI sistemlerini hayal ediyor. Bu sistem günlük işlerinde onlara yardımcı olmak için gördüklerini, yaptıklarını ve duyduklarını kaydedecek. Facebook araştırmacıları, “aralıklı bellek” (“anahtarlarımı nerede bıraktım?” gibi soruları yanıtlama) ve “görsel-işitsel günlükleştirme” (kimin neyi ne zaman söylediğini hatırlama) dahil olmak üzere bu sistemlerin geliştirmesini istediği bir dizi beceri üzerinde çalışıyor.
Görülen o ki şu anda, yukarıda belirtilen görevler herhangi bir AI sistemi tarafından güvenilir bir şekilde gerçekleştirilemez. Kişisel veriler ve ticari ahlak konusunda yakın geçmişi kırık notlarla dolu olan Facebook, bunun ticari bir geliştirmeden ziyade bir araştırma projesi olduğunu vurguluyor. Ancak, şirketin bu gibi işlevleri bilişimin geleceği olarak gördüğü açık. Facebook AI araştırma bilimcisi Kristen Grauman, verdiği bir demeçte, “Artırılmış gerçeklik ve bu gerçeklikle ne yapmak istediğimizi düşünürsek, yolun sonunda bu tür araştırmalardan her anlamda yararlanabileceğimiz olasılığı elbette var” diyerek aslında soru işaretlerinin boşuna olmadığını göstermiş oldu.
Gizlilik uzmanları, Facebook’un AR gözlüklerinin, kullanıcıların gizlice insanları kaydetmesi ve mahremiyetlerini çiğnemesi konusunda zaten endişeli. Bu tür endişeler, yalnızca donanımın görüntüleri kaydetmekle kalmayacağı, aynı zamanda bunları analiz edip yazıya dökerek kullanıcıları yürüyen gözetim makinelerine dönüştürme ihtimallerini de doğuruyor. Ve bu şimdilik en kötü senaryo olarak görünüyor.
Facebook’un araştırma projesinin adı, birinci şahıs veya “ben merkezli” videonun analizine atıfta bulunan Ego4D. İki ana bileşenden oluşuyor: açık bir benmerkezci video veri seti ve Facebook’un AI sistemlerinin gelecekte çözebileceğini düşündüğü bir dizi kıyaslama.
Veri seti, türünün şimdiye kadar oluşturulmuş en büyüğüdü ve Facebook, verileri toplamak için şimdiden dünya çapında 13 üniversite ile ortaklık kurmuş durumda. Toplamda, dokuz farklı ülkede yaşayan 855 katılımcı tarafından yaklaşık 3.205 saatlik görüntüler bu test aşamasında kaydedildi. Verilerin toplanmasından Facebook yerine üniversiteler sorumluydu. Bazılarına ödeme yapılan katılımcılar, herhangi bir senaryo barındırmayan günlük etkinliklerin videosunu kaydetmek için GoPro kameraları ve AR gözlükleri taktı. Bu, inşaat işlerinden fırıncılığa, evcil hayvanlarla oynamaya ve arkadaşlarla sosyalleşmeye kadar uzanan bir dizi görüntüler oluşturdu. Tüm görüntülerin kimlikleri üniversiteler tarafından gizlendi, buna seyircilerin yüzlerinin bulanıklaştırılması ve kişisel olarak tanımlanabilir bilgilerin kaldırılması da dahil.
Grauman, veri kümesinin “hem ölçek hem de çeşitlilik açısından türünün ilk örneği” olduğunu söylüyor. En yakın karşılaştırılabilir projenin, tamamen mutfaklarda çekilmiş 100 saatlik birinci şahıs çekimlerini içerdiğini söylüyor . “Bu yapay zeka sistemlerinin gözlerini İngiltere ve Sicilya’daki mutfaklardan daha fazlasına, Suudi Arabistan, Tokyo, Los Angeles ve Kolombiya’dan [görüntülere] açtık.”
Ego4D’nin ikinci bileşeni, Facebook’un dünya çapındaki araştırmacıların kendi veri kümesinde eğitilmiş AI sistemlerini kullanarak denemelerini ve çözmelerini istediği bir dizi kıyaslama veya görev. Şirket bunları şöyle açıklıyor:
Epizodik hafıza : Ne zaman oldu (örneğin, “Anahtarlarımı nerede bıraktım?”)?
Tahmin : Bundan sonra ne yapacağım (örneğin, “Bekle, bu yemek tarifine zaten tuz ekledin”)?
El ve nesne manipülasyonu : Ne yapıyorum (örneğin, “Bana davul çalmayı öğret”)?
Görsel-işitsel günlükleştirme : Kim neyi ne zaman söyledi (örneğin, “Derste ana konu neydi?”)?
Sosyal etkileşim : Kim kiminle etkileşime giriyor (örneğin, “Bu gürültülü restoranda benimle konuşan kişiyi daha iyi duymama yardım et”)?
Şu anda, AI sistemleri bu sorunlardan herhangi birinin üstesinden gelmeyi inanılmaz derecede zor buluyor, ancak veri kümeleri ve kıyaslamalar oluşturmak, AI alanında gelişmeyi teşvik etmek için denenmiş ve test edilmiş yöntemler.
Facebook, Ego4D projesinin artırılmış gerçeklik dünyası için benzer etkilere sahip olmasını umuyor. Şirket, Ego4D üzerinde eğitilen sistemlerin bir gün yalnızca giyilebilir kameralarda değil, aynı zamanda çevrelerindeki dünyayı dolaşmak için birinci şahıs kameralara dayanan ev asistan robotlarında da kullanılabileceğini söylüyor.
Grauman, “Proje, bu alandaki çalışmaları henüz gerçekten mümkün olmayan bir şekilde katalize etme şansına sahip” diyor. “Alanımızı, gerçek insanlar tarafından çekilmiş fotoğraf ve video yığınları ile doldurduğumuzda sistem analiz etme yeteneğini artırmış olacak.”
Facebook’un ana hatlarıyla belirttiği görevler kesinlikle pratik görünse de, şirketin bu alana olan ilgisi pek çok kişiyi endişelendirecek. Facebook’un gizlilik konusundaki sicili, veri sızıntılarını ve FTC’den 5 milyar dolarlık para cezalar ile yeteince kirli durumda. Ayrıca hem eski çalışan hem de bazı yöneticiler Netdflix belgeselinde şahitlk yapmak da dahil şirket değerlerini aşağı çekmek için büyük çaba sarf etti.
Bunu akılda tutarak, bu Ego4D projesindeki kıyaslamaların belirgin gizlilik önlemleri içermemesi endişe verici. Örneğin, “görsel-işitsel günlükleştirme” görevi (farklı kişilerin söylediklerinin yazıya dökülmesi), kaydedilmek istemeyen kişilerle ilgili verilerin kaldırılmasından asla bahsetmiyor.
Bu sorunlar hakkında soru sorulduğunda, bir Facebook sözcüsü, gizlilik önlemlerinin daha da ileriye götürülmesini beklediğini söyledi. Sözcü, “Şirketlerin bu veri setini ve kıyaslamayı ticari uygulamalar geliştirmek için kullandıkları ölçüde, bu tür uygulamalar için güvenlik önlemleri geliştirmelerini bekliyoruz” dedi. “Örneğin, AR gözlükleri birinin sesini iyileştirmeden önce, başka birinin gözlüğünden izin istemek için izleyecekleri bir protokol olabilir veya cihazın menzilini sınırlayabilir, böylece yalnızca gözlükleri olan kişilerden ses alabilir.”
Şimdilik, bu tür güvenlik önlemleri yalnızca varsayımsal olmaktan öteye geçemiyor.