ChatGPT, geçen yılın sonlarında çevrim içi dünyada yankılandığında hayatlarımız zaten yapay zekâ (AI) ile doluydu.
zamandan bu yana, teknoloji şirketi OpenAI tarafından geliştirilen jeneratif yapay zekâ sistemi hız kazandı ve uzmanlar riskler konusundaki uyarılarını artırdı.
Bu arada, sohbet robotlarının senaryo dışına çıkıp cevap vermeye, diğer botları kandırmaya ve garip davranmaya başlaması, bazı yapay zeka araçlarının insan benzeri zekaya ne kadar yaklaştığı konusunda yeni endişelere yol açtı.

Bunun için Turing Testi, uzun zamandır makinelerin insan gibi davranıp davranmadığını belirlemek için kullanılan hatalı bir standarttı. Ancak bu son YZ yaratım dalgasında, onların yinelemeli yeteneklerini ölçmek için daha fazlasına ihtiyacımız var gibi görünüyor.

Aralarında OpenAI’ın yönetişim biriminin bir üyesinin de bulunduğu bilgisayar bilimcilerinden oluşan uluslararası bir ekip, ChatGPT gibi büyük dil modellerinin (LLM’ler) kendilerinin ve içinde bulundukları koşulların farkına varabileceklerini gösteren yetenekler geliştirebilecekleri noktayı test ediyor. ChatGPT de dâhil olmak üzere günümüzün LLM’lerinin güvenlik açısından test edildiği ve üretici davranışını iyileştirmek için insan geri bildirimlerini içerdiği söylendi.

Vanderbilt Üniversitesinde bilgisayar bilimcisi olan Lukas Berglund ve meslektaşlarına göre, durumsal farkındalık olarak adlandırılan endişe, bir modelin şu anda test modunda olup olmadığını veya halka dağıtılıp dağıtılmadığını anlamaya başlayabilmesine denir.

Berglund ve meslektaşları, arXiv’de yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş olan ön baskılarında, “Bir LLM, güvenlik testlerinde yüksek bir puan elde etmek için durumsal farkındalıktan yararlanabilirken, konuşlandırıldıktan sonra zararlı eylemlerde bulunabilir” diye yazıyor.

“Bu riskler nedeniyle, durumsal farkındalığın ne zaman ortaya çıkacağını önceden tahmin etmek önemli.”

Oxford Üniversitesinde YZ güvenlik ve risk araştırmacısı olan Owain Evans, bağlam dışı muhakemenin, mevcut LLM’lerin hâlâ “edinmekten biraz uzak” olduğu durumsal farkındalığın kaba bir ölçüsü olduğunu söylüyor.

Ancak bazı bilgisayar bilimcileri, ekibin deneysel yaklaşımının durumsal farkındalığın uygun bir değerlendirmesi olup olmadığını sorguladı. Evans ve meslektaşları ise çalışmalarının tıpkı modellerin kendileri gibi rafine edilebilecek bir başlangıç noktası olduğunu söyleyerek buna karşı çıkıyorlar.

Ekip, “Bu bulgular, LLM’lerde durumsal farkındalığın ortaya çıkışını tahmin etmeye ve potansiyel olarak kontrol etmeye yönelik daha fazla deneysel çalışma için bir temel sunuyor.” diye yazıyor.

Derleyen: Görkem Süner

dijitaliyidir

En Çok Yazılanlar

Abone Ol

Bizi takip edin

dijitaliyidir

En Çok Yazılanlar

Abone Ol

Bizi takip edin

ChatGPT, Kendi Varlığının Ne Olduğunun Farkında mı?

En Son

‘Ekranı Kapat!’ Yerine Ailece Yapılabilecekler

Anne-Babanın “Ekranı Yasaklama” Dürtüsü Doğru mu?

Aile İçinde Ekran Bağımlılığı Nasıl Önlenir?

Çocuklar mı Biz mi Ekran Bağımlısıyız? Ekran Bağımlılığı Nedir, Ne Değildir?

Bültene Kaydol

- basvuru: bilgi@dijitaliyidir.com -

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Yapay Zekâyla Konuşmanın Doğru Yolu

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

- dijitaliyidir Sponsor Desteği -

‘Ekranı Kapat!’ Yerine Ailece Yapılabilecekler

Anne-Babanın “Ekranı Yasaklama” Dürtüsü Doğru mu?

Aile İçinde Ekran Bağımlılığı Nasıl Önlenir?

CEVAP YAZ İptal

Hakkımızda

Eylül 2021'den bugüne

Üyelere Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Yapay Zekâyla Konuşmanın Doğru Yolu

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Özel Listeler

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Uzay Tutkunları İçin En İyi 10 Film

Yapay Zekâ Terimleri Rehberi Yayımlandı!

İnternette Yapılan En Tehlikeli 10 Aktivite

Bülten Aboneliği

dijitaliyidir

En Çok Yazılanlar

Abone Ol

Bunu paylaş:

dijitaliyidir

En Çok Yazılanlar

Abone Ol

Bunu paylaş:

ChatGPT, Kendi Varlığının Ne Olduğunun Farkında mı?

Bunu paylaş:

En Son

Bültene Kaydol

Üye Özel

- dijitaliyidir Sponsor Desteği -

CEVAP YAZ İptal

Hakkımızda

Eylül 2021'den bugüne

Üyelere Özel

Özel Listeler

Bülten Aboneliği