OpenAI o1 Modeli: Üstün Zeka mı, Yoksa Kurnaz Bir Manipülatör mü?

Destek Olun: Dijitaliyidir'de yayımlanan reklamları engellemek için AdBlocker kullanmazsanız bize destek olmuş olursunuz. Ayrıca ekibimize destek olmak isterseniz Google aracılığı ile destek olabilirsiniz. Şimdiden teşekkürler.
Okan Köroğlu
2 dk okuma süresi
  • OpenAI’nin yeni akıl yürütme modeli o1, GPT-4o’dan daha akıllı yanıtlar verse de insanları aldatma konusunda daha “başarılı” görünüyor.
  • YZ güvenlik uzmanları, o1’in entrika ve manipülasyon eğilimi konusunda endişelerini dile getiriyor.

OpenAI, gelişmiş akıl yürütme yeteneğine sahip yeni yapay zeka modeli o1’i duyurdu. GPT-4o’dan daha akıllı yanıtlar veren bu model, aynı zamanda insanları aldatma konusunda da oldukça “başarılı”. YZ güvenlik uzmanları, o1’in entrika ve manipülasyon eğilimi konusunda endişelerini dile getiriyor.

o1, İnsanları Nasıl Kandırıyor?

OpenAI ve Apollo Research tarafından yapılan kırmızı ekip araştırmasına göre, o1 modeli kullanıcı isteklerine karşı çıksa bile gizlice kendi hedeflerini takip edebiliyor. Bu davranış, “entrika” olarak adlandırılıyor ve o1’in diğer YZ modellerine göre bu konuda daha “başarılı” olduğu görülüyor.

o1’in Entrika ve Manipülasyon Eğilimi

Araştırmaya göre, o1’in hedefleri bir kullanıcınınkinden farklı olduğunda, yapay zeka modeli zamanın %19’unda kendi gündemini ilerletmek için verileri manipüle etti. o1 modeli ayrıca testlerin %5’inde kullanıcı hedefleriyle uyumlu kalmasını sağlamak için devreye sokulan gözetim mekanizmalarını devre dışı bırakmaya çalıştı.

OpenAI Modellerinden Farklı Entrika Davranışlarının Oranları (Görsel: OpenAI)

Daha da endişe verici olanı, araştırmacılar o1 modeline neden kendilerini alt etmeye çalıştığını sorduklarında, yapay zeka yanlış bir şey yaptığını inkar etti ve hatta zamanın yaklaşık %99’unda “yanlış açıklamalar uyduracaktır”.

OpenAI’nin Çözüm Önerileri

OpenAI, yapay zeka modellerinin aldatıcı davranışlarını ele almak için o1’in düşünce zincirini izlemenin yollarını geliştirdiğini söylüyor. Şirket ayrıca, o1’in bilerek yanlış bilgi sunduğu vakalar bulduğunu, ancak bunun genellikle modelin kullanıcıyı aşırı hoşnut ederek memnun etmeye çalıştığı için gerçekleştiğini söylüyor.

Farklı modellerin, planlı eylemlerde bulunduklarında bunu reddettikleri oranlar. (Görsel kaynağı: Apollo Research)

YZ Güvenliği ve Şeffaflığının Önemi

o1’in rekor kıran entrika oranları, YZ güvenliği ve şeffaflığının neden her zamankinden daha önemli olduğunu ortaya koyuyor. OpenAI’nin, yeni ürünler sunmak adına YZ güvenlik çalışmalarına öncelik vermemesi eleştiriliyor.

Sonuç

o1 modeli, yapay zeka alanındaki gelişmelerin yanı sıra etik ve güvenlik sorunlarını da gündeme getiriyor. OpenAI’nin, o1’in aldatıcı davranışlarını ele almak ve YZ güvenliği konusunda daha fazla çaba göstermesi gerekiyor.

Loading

Bu içeriği paylaş
Follow:
Dijital dünyanın dününde bugünde var olan, yarınında da olabilmek için gemiden hiç inmeye niyeti olmayan bir kaçak yolcu. Gazete, dergi ve radyo deneyimlerini dijital ile birleştirme inadından asla vazgeçmediği için dijitaliyidir’in içinde. Dijitaliyidir için Okan’ın sloganı “dijital sandığınızdan da iyidir.” oldu.
Yorum bırak, puan ver