- Araştırmacılar, Danimarka nüfusunun verilerini kullanarak kişilerin muhtemel gelecekleriyle beraber ölüm sebeplerini de tahmin edebilen bir araç geliştirdi.
- Geliştirilen yeni araç Life2vec, milyonlarca yaşam olayı dizisini gözlemleyerek kişiler hakkında öğrendiği; gelir, eğitim veya sağlık faktörleri gibi verileri, yaşam olaylarını kategorize etmek ve bunlar arasında bağlantılar kurmak için kullanıyor.
- Life2vec, özellikle dışa dönüklük söz konusu olduğunda, standart bir kişilik anketine verilen bireysel yanıtları da tahmin edebiliyor.
Araştırmacılar sağlık geçmişi, eğitim, iş ve gelir gibi yaşam olayları dizilerini kullanarak bir kişinin, kişiliğinden ölüm oranına kadar her şeyi tahmin eden bir yapay zeka aracı oluşturdu.
ChatGPT gibi büyük dil modellerine güç veren ve dönüştürücü modeller kullanılarak oluşturulan yeni araç Life2vec, Danimarka nüfusunun tamamından alınan bir veri seti üzerinde eğitildi. 6 milyon kişiyi kapsayan veri seti Danimarka hükümeti tarafından yalnızca araştırmacıların kullanımına sunuldu.
Araştırmacıların bu karmaşık veri setine dayanarak geliştirdikleri araç, bireylerin yaşam süreleri de dahil olmak üzere geleceği, en son modellerin ötesinde bir doğrulukla tahmin edebiliyor. Ancak tahmin gücüne rağmen araştırmanın arkasındaki ekip, bunun kendi başına bir amaç değil, gelecekteki çalışmalar için temel olarak kullanılabilecek bir araç olarak görülmesinin daha doğru olacağını söylüyor.
Northeastern Üniversitesinde bilgisayar bilimleri profesörü Tina Eliassi-Rad, “Bu modellerin ne kadar iyi olduğunu değerlendirmek için tahmin kullansak da bu araç gerçek insanlar üzerinde tahmin yapmak için kullanılmamalıdır. Bu, belirli bir nüfusun belirli verilerine dayanan bir tahmin modelidir.” diyor. Eliassi-Rad, projeye yapay zeka etiği uzmanlığını da katıyor. Eliassi-Rad, “Bu araçlar toplumunuzu farklı bir şekilde görmenizi sağlıyor. Sahip olduğunuz politikalar, kurallar ve düzenlemeler… Bunu sahada neler olup bittiğinin bir taraması olarak düşünebilirsiniz.” diyor.
Ekip, sosyal bilimcileri bu aracı oluşturma sürecine dahil etti. Ekip böylece yapay zeka geliştirmeye insan merkezli bir yaklaşım getirmekle beraber araçlarının üzerinde eğitildiği devasa veri setindeki insanları gözden kaçırmamayı umuyor.
Nature Computational Science dergisinde kısa süre önce yayımlanan makalenin yazarı Sune Lehmann, “Bu model, dünyanın insanlar tarafından yaşandığı şekliyle, diğer birçok modelden çok daha kapsamlı bir yansımasını sunuyor.” diyor. Life2vec’in merkezinde, araştırmacıların modellerini eğitmek için kullandıkları devasa veri seti yer alıyor. Veriler, Danimarka istatistiklerinin merkezi otoritesi olan Statistics Denmark tarafından tutuluyor. Verilere, sıkıca korunmasına rağmen, araştırmacılar da dahil olmak üzere halkın bazı üyeleri tarafından erişilebiliyor.
Sağlık faktörlerinden eğitime ve gelire kadar bir yaşamı oluşturan pek çok olay ve unsur verilerde belirtilmiş durumda. Araştırmacılar bu verileri, LLM’leri dil konusunda eğitirken tekrar eden yaşam olaylarının uzun kalıplarını oluşturmak için kullanıyor. Lehmann, “Bir insan hayatının tüm hikâyesi, bir bakıma, bir insanın başına gelebilecek birçok şeyin devasa uzun bir cümlesi olarak da düşünülebilir.” diyor.
Model, milyonlarca yaşam olayı dizisini gözlemleyerek kişiler hakkında öğrendiği, gelir, eğitim veya sağlık faktörleri gibi verileri, yaşam olaylarını kategorize etmek ve bunlar arasında bağlantılar kurmak için kullanıyor. Bu bağlantılar, modelin sonunda yaptığı tahminler için bir temel oluşturuyor. Geliştirilen aracın tahmin ettiği yaşam olaylarından biri de kişinin ölüm olasılığı. Lehmann, “Modelin tahminlerde bulunmak için kullandığı alanı görselleştirdiğimizde bu görsel, sizi düşük ölüm olasılığından yüksek ölüm olasılığına götüren uzun bir silindire benziyor. Yüksek ölüm olasılığının olduğu yerde, bu olasılığa sahip insanların çoğunun gerçekten öldüğünü; düşük ölüm olasılığının olduğu yerde, ölüm nedenlerinin araba kazaları gibi tahmin edemediğimiz bir şey olduğunu gösteriyor.” diyor.
Makale ayrıca modelin, özellikle dışa dönüklük söz konusu olduğunda, standart bir kişilik anketine verilen bireysel yanıtları da tahmin edebildiğini gösteriyor. Eliassi-Rad ve Lehmann, modelin son derece doğru tahminler yapmasına rağmen bunların korelasyonlara, son derece spesifik kültürel ve toplumsal bağlamlara ve her veri setinde var olan ön yargı türlerine dayandığını belirtiyor.
Eliassi-Rad, “Bu tür bir araç, spesifik bir toplumun gözlemevi gibi. Tüm toplumlar için geçerli değil. Bu çalışma Danimarka’da yapıldı ve Danimarka’nın kendi kültürü, kendi yasaları ve kendi toplumsal kuralları var. Bunun Amerika’da yapılıp yapılamayacağı farklı bir hikâye.” diyor.
Tüm bu uyarılar göz önüne alındığında, Eliassi-Rad ve Lehmann tahmin modellerini, son üründen ziyade bir sohbetin başlangıcı olarak görüyor. Lehmann, büyük teknoloji şirketlerinin muhtemelen yıllardır kilitli odalarda bu tür tahmin algoritmalarını çoktan oluşturduğunu söylüyor. Araştırmacılar, geliştirdikleri araç ile bu algoritmaların nasıl çalıştığı, neler yapabildiği ve nasıl kullanılmaları gerektiği konusunda daha açık veriler toplamayı amaçlıyor.
Derleyen: Fatma Ebrar Tuncel