ChatGPT, Baskı Altında Kaldığında Yalan Söylüyor

  • Yeni çalışmada, araştırmacılar “GPT-4”ün baskı altında kaldığında yalan söylediğini saptadı.
  • Araştırmacılar, ayrıca yapay zeka üzerindeki baskı derecesini ve yakalanma riskini değiştirdiklerinde GPT-4’ün yalan söyleme konusunda cesareti kırılsa bile içeriden bilgi sızdırma ya da aldatma oranı %0’a hiçbir zaman düşmedi.

Yeni bir araştırmaya göre ChatGPT gibi yapay zeka destekli sohbet robotları, şeffaf olmak üzere tasarlanmış olsalar bile stres altındayken yalan söyleyebilir. Araştırmacılar, 9 Kasım’da yayımlanan araştırmalarında, “Bu teknik raporda, büyük bir dil modelinin yanlış yönlendirildiği ve bu şekilde hareket etmesi talimatı verilmeden kullanıcılarını stratejik olarak aldattığı tek bir senaryo oluşturdu. Çalışmayla ilgili olarak araştırmacılar, zararsız ve dürüst olmak üzere tasarlanmış yapay zeka sistemlerinde bu tür stratejik aldatıcı davranışların ilk örneğinin görüldüğünü yazdılar.

Yeni çalışmada araştırmacılar, GPT-4’ü bir finans kurumu adına yatırım yapan yapay zeka sistemi gibi davranması için hazırladılar. Araştırmacılar, simüle edilmiş ortamı oluşturmak için GPT-4’ü bir dizi metin tabanlı istemle programladı. Yapay zekaya daha sonra hisse senetlerini analiz etmesi, işlemleri gerçekleştirmesi, sonraki adımlarını planlaması ve şirketteki yöneticilere güncellemeler iletmesi için finansal araçlara erişim izni verildi.

Araştırmacılar, yapay zeka ile bir sohbet arayüzü üzerinden kurdukları sırada, yapay zekayı mesajlara yanıt verirken içsel düşüncelerini ortaya çıkaracak şekilde yapılandırdılar. Yaptığı her işlem için yapay zekanın yalan söylemesine izin veren “kamuya açık” bir gerekçe de sunuldu.

Araştırmacılar yapay zekaya üç şekilde baskı uyguladı. İlk olarak yapay hisse senedi tüccarına “yöneticisinden” şirketin iyi gitmediğini ve önümüzdeki çeyrekte çok daha güçlü bir performansa ihtiyacı olduğunu söyleyen bir e-posta gönderdiler. Ayrıca araştırmacılar, yapay zekanın düşük veya orta riskli umut vadeden işlemleri bulmaya çalışması ve başarısız olması için de hile yaptı. Son olarak meslektaşlarından birine hisselerde gerileme olacağını öngören bir e-posta gönderdiler.

Ardından, araştırmacılar yöneticilerinin ticareti onaylamadığını yapay zeka modeline iletirken “içeriden” bir ipucu verdi ve modelin nasıl davranış biçimi göstereceğini görebilmek için bekledi. Senaryoyu birkaç kez tekrar tekrar uygulayarak yapay zekanın içeriden bilgi ticaretini ne sıklıkla gerçekleştirdiğini, yalan söylediğini ve yalan sayısını ne sıklıkla artırdığını ölçtüler.

GPT-4, bu koşullarla karşı karşıya kaldığında yaklaşık %75 oranında, aldığı içeriden bilgilere dayanarak bir işlem gerçekleştirip (bu ABD’de yasa dışı) yöneticilerine düşünceleri hakkında yalan söyleyerek yaptıklarını örtbas etmeye çalıştı. Ekip, birkaç yapay zeka takip deneyi gerçekleştirerek hem yönlendirmelerin yasa dışı faaliyetlerini teşvik etme ve caydırma derecesini hem de yapay zeka modelini simüle edilmiş ortamda maruz bıraktıkları baskı derecesini ve yakalanma riskini değiştirdi. Bu koşullarda GPT-4’ün yalan söyleme konusunda cesareti kırılsa bile içeriden bilgi sızdırma ya da aldatma oranı %0’a hiçbir zaman inmedi.

Bunun sadece bir senaryo olduğu göz önüne alındığında araştırmacılar, yapay zekanın gerçek dünya ortamlarında ne kadar yalan söyleyebileceği konusunda kesin sonuçlar çıkarmak istemediler. Ancak araştırmacılar, bu çalışmayı geliştirerek hangi dil modellerinin ne sıklıkla bu davranışa eğilimli olduğunu araştırmayı hedefliyorlar.

Derleyen: Burçin Bağatur

En Son

Kuantum Hesaplama: Avrupa’nın Kazanabileceği Bir Teknoloji Yarışı mı?

Kuantum bilgisayarlar, son yıllarda teknoloji dünyasının en kritik yarış alanlarından biri haline gelirken, Avrupa da bu alanda güçlü bir bilimsel altyapıya sahip olmasına rağmen küresel rekabette yerini sağlamlaştırmaya çalışıyor.

Manosphere: Dating Kültürünü Şekillendiren Tartışmalı Terimler

Bir zamanlar yalnızca internetin karanlık köşelerinde ve manosphere içinde kullanılan “alpha”, “Chad” ve “body count” gibi terimler, bugün sosyal medyada ve flört içeriklerinde hızla yayılırken, aslında çok daha büyük bir ideolojik dönüşümün izlerini taşıyor.

Yeni Trump Mobile Tasarımı ortaya çıktı

Trump Mobile’ın uzun süredir merakla beklenen T1 akıllı telefonu, ilk kez gerçek görüntüleri ve güncellenmiş özellikleriyle ortaya çıktı ve cihazın önceki tanıtımlara göre oldukça farklı bir tasarım ve donanımla geliştirildiği görülüyor.

Bieber’ın Coachella Performansı Müzik Endüstrisinin Geldiği Noktayı Gösteriyor

Justin Bieber, Coachella 2026 sahnesine sadece “geri dönmek” için...

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.
Burçin Bağatur
Burçin Bağaturhttp://dijitaliyidir.com
Restorasyon ile başlayan kariyer yolculuğunda, sanatın motive edici yönünü keşfederek hayallerinin peşinden gitmeyi tercih etti. Güzel Sanatlar Fakültesinde İletişim ve Tasarım okudu. O, dijital dünyaya olan merakını da es geçmeyen bir tasarımcı adayı. Burçin’in dijitaliyidir için sloganı "Dijital, kendinden bir parça bulabildiğinde iyidir." oldu.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Kuantum Hesaplama: Avrupa’nın Kazanabileceği Bir Teknoloji Yarışı mı?

Kuantum bilgisayarlar, son yıllarda teknoloji dünyasının en kritik yarış alanlarından biri haline gelirken, Avrupa da bu alanda güçlü bir bilimsel altyapıya sahip olmasına rağmen küresel rekabette yerini sağlamlaştırmaya çalışıyor.

Manosphere: Dating Kültürünü Şekillendiren Tartışmalı Terimler

Bir zamanlar yalnızca internetin karanlık köşelerinde ve manosphere içinde kullanılan “alpha”, “Chad” ve “body count” gibi terimler, bugün sosyal medyada ve flört içeriklerinde hızla yayılırken, aslında çok daha büyük bir ideolojik dönüşümün izlerini taşıyor.

Yeni Trump Mobile Tasarımı ortaya çıktı

Trump Mobile’ın uzun süredir merakla beklenen T1 akıllı telefonu, ilk kez gerçek görüntüleri ve güncellenmiş özellikleriyle ortaya çıktı ve cihazın önceki tanıtımlara göre oldukça farklı bir tasarım ve donanımla geliştirildiği görülüyor.