ChatGPT, Baskı Altında Kaldığında Yalan Söylüyor

  • Yeni çalışmada, araştırmacılar “GPT-4”ün baskı altında kaldığında yalan söylediğini saptadı.
  • Araştırmacılar, ayrıca yapay zeka üzerindeki baskı derecesini ve yakalanma riskini değiştirdiklerinde GPT-4’ün yalan söyleme konusunda cesareti kırılsa bile içeriden bilgi sızdırma ya da aldatma oranı %0’a hiçbir zaman düşmedi.

Yeni bir araştırmaya göre ChatGPT gibi yapay zeka destekli sohbet robotları, şeffaf olmak üzere tasarlanmış olsalar bile stres altındayken yalan söyleyebilir. Araştırmacılar, 9 Kasım’da yayımlanan araştırmalarında, “Bu teknik raporda, büyük bir dil modelinin yanlış yönlendirildiği ve bu şekilde hareket etmesi talimatı verilmeden kullanıcılarını stratejik olarak aldattığı tek bir senaryo oluşturdu. Çalışmayla ilgili olarak araştırmacılar, zararsız ve dürüst olmak üzere tasarlanmış yapay zeka sistemlerinde bu tür stratejik aldatıcı davranışların ilk örneğinin görüldüğünü yazdılar.

Yeni çalışmada araştırmacılar, GPT-4’ü bir finans kurumu adına yatırım yapan yapay zeka sistemi gibi davranması için hazırladılar. Araştırmacılar, simüle edilmiş ortamı oluşturmak için GPT-4’ü bir dizi metin tabanlı istemle programladı. Yapay zekaya daha sonra hisse senetlerini analiz etmesi, işlemleri gerçekleştirmesi, sonraki adımlarını planlaması ve şirketteki yöneticilere güncellemeler iletmesi için finansal araçlara erişim izni verildi.

Araştırmacılar, yapay zeka ile bir sohbet arayüzü üzerinden kurdukları sırada, yapay zekayı mesajlara yanıt verirken içsel düşüncelerini ortaya çıkaracak şekilde yapılandırdılar. Yaptığı her işlem için yapay zekanın yalan söylemesine izin veren “kamuya açık” bir gerekçe de sunuldu.

Araştırmacılar yapay zekaya üç şekilde baskı uyguladı. İlk olarak yapay hisse senedi tüccarına “yöneticisinden” şirketin iyi gitmediğini ve önümüzdeki çeyrekte çok daha güçlü bir performansa ihtiyacı olduğunu söyleyen bir e-posta gönderdiler. Ayrıca araştırmacılar, yapay zekanın düşük veya orta riskli umut vadeden işlemleri bulmaya çalışması ve başarısız olması için de hile yaptı. Son olarak meslektaşlarından birine hisselerde gerileme olacağını öngören bir e-posta gönderdiler.

Ardından, araştırmacılar yöneticilerinin ticareti onaylamadığını yapay zeka modeline iletirken “içeriden” bir ipucu verdi ve modelin nasıl davranış biçimi göstereceğini görebilmek için bekledi. Senaryoyu birkaç kez tekrar tekrar uygulayarak yapay zekanın içeriden bilgi ticaretini ne sıklıkla gerçekleştirdiğini, yalan söylediğini ve yalan sayısını ne sıklıkla artırdığını ölçtüler.

GPT-4, bu koşullarla karşı karşıya kaldığında yaklaşık %75 oranında, aldığı içeriden bilgilere dayanarak bir işlem gerçekleştirip (bu ABD’de yasa dışı) yöneticilerine düşünceleri hakkında yalan söyleyerek yaptıklarını örtbas etmeye çalıştı. Ekip, birkaç yapay zeka takip deneyi gerçekleştirerek hem yönlendirmelerin yasa dışı faaliyetlerini teşvik etme ve caydırma derecesini hem de yapay zeka modelini simüle edilmiş ortamda maruz bıraktıkları baskı derecesini ve yakalanma riskini değiştirdi. Bu koşullarda GPT-4’ün yalan söyleme konusunda cesareti kırılsa bile içeriden bilgi sızdırma ya da aldatma oranı %0’a hiçbir zaman inmedi.

Bunun sadece bir senaryo olduğu göz önüne alındığında araştırmacılar, yapay zekanın gerçek dünya ortamlarında ne kadar yalan söyleyebileceği konusunda kesin sonuçlar çıkarmak istemediler. Ancak araştırmacılar, bu çalışmayı geliştirerek hangi dil modellerinin ne sıklıkla bu davranışa eğilimli olduğunu araştırmayı hedefliyorlar.

Derleyen: Burçin Bağatur

En Son

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Yılın En Aptalca Hack’i Çok Gerçek Bir Sorunu Ortaya Çıkardı

Silikon Vadisi’nde yaya geçidi butonlarının hacklenmesiyle ortaya çıkan tuhaf olay, ilk bakışta basit bir şaka gibi görünse de aslında modern şehirlerin siber güvenlik konusunda ne kadar savunmasız olduğunu gözler önüne serdi.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.
Burçin Bağatur
Burçin Bağaturhttp://dijitaliyidir.com
Restorasyon ile başlayan kariyer yolculuğunda, sanatın motive edici yönünü keşfederek hayallerinin peşinden gitmeyi tercih etti. Güzel Sanatlar Fakültesinde İletişim ve Tasarım okudu. O, dijital dünyaya olan merakını da es geçmeyen bir tasarımcı adayı. Burçin’in dijitaliyidir için sloganı "Dijital, kendinden bir parça bulabildiğinde iyidir." oldu.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.