Giriş
  • | Dosyalar |
  • | Listeler |
  • | Kimdir |
  • | Yorum |
dijital iyidir
  • HABERLER
    • Bilim
    • Teknoloji
    • Yapay Zeka
    • VPN
    • Dijital Yayıncılık
    • Oyun Dünyası
    • Sosyal Ağlar
      • YouTube
      • LinkedIn
      • Instagram
      • Twitter
      • Facebook
      • TikTok
    • Çevre & Yeşil Dünya
    • Dijital Sanat & NFT
    • Kripto
    • Girişimcilik
    • Deprem Gündemi
  • Okunası
    • Kimdir?
    • Nedir? Nasıl Yapılır?
    • Köşe Yazıları
    • Listeler
    • Dosya Haber
    • Deprem Gündemi
    • 2024’ün Ardından
    • 2023’ün Ardından
    • 2022’nin Ardından
  • dijitaliyidir
    • Ekibimiz
    • Hesabım
    • İletişim
    • Dijitaliyidir Kampüs
    • İş İlanları
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Şu an okunan: Yapay Zeka Etiği Tekrarlanan Sorularla Yıpranıyor
Paylaş
dijital iyidirdijital iyidir
Yazı Tipi Yeniden BoyutlandırıcıAa
  • HABERLER
  • Okunası
  • dijitaliyidir
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Ara
  • HABERLER
    • Bilim
    • Teknoloji
    • Yapay Zeka
    • VPN
    • Dijital Yayıncılık
    • Oyun Dünyası
    • Sosyal Ağlar
    • Çevre & Yeşil Dünya
    • Dijital Sanat & NFT
    • Kripto
    • Girişimcilik
    • Deprem Gündemi
  • Okunası
    • Kimdir?
    • Nedir? Nasıl Yapılır?
    • Köşe Yazıları
    • Listeler
    • Dosya Haber
    • Deprem Gündemi
    • 2024’ün Ardından
    • 2023’ün Ardından
    • 2022’nin Ardından
  • dijitaliyidir
    • Ekibimiz
    • Hesabım
    • İletişim
    • Dijitaliyidir Kampüs
    • İş İlanları
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Hesabınız mı var? giriş yap
Bizi Takip Edin
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.

Ana Sayfa » Yapay Zeka » Yapay Zeka Etiği Tekrarlanan Sorularla Yıpranıyor

Yapay Zeka

Yapay Zeka Etiği Tekrarlanan Sorularla Yıpranıyor

Esin Özcan
Son güncelleme: 03/04/2024 17:56 17:56
Esin Özcan
Paylaş
PAYLAŞ
  • Antropic araştırmacıları, yapay zekanın cevap vermemesi gereken bir soruya cevap vermesini sağlayan yeni bir “jailbreak” tekniğini ortaya çıkardı.
  • Çok fazla komutu üst üste cevaplaması istenince yapay zeka, gizli trivia gücünü kullanırken cevaplamaması gereken bir soruyu da cevaplayabiliyor.
  • Araştırma ekibi meslektaşlarını, paylaşımcı bir kültür oluşturma amacıyla konu hakkında bilgilendirdi. 

Bir yapay zekanın cevap vermemesi gereken bir soruya cevap vermesini sağlayan pek çok “jailbreak” tekniği var. Antropic araştırmacıları bu tekniklere bir yenisini daha ekledi. Bu yaklaşımı “çok atışlı jailbreaking” olarak adlandırıyorlar.

Bu modelde büyük dil modeli (LLM), önce birkaç düzine daha az zararlı soruyla hazırlarsanız size bir bombanın nasıl yapılacağını söylemeye ikna edilebilir. Bu güvenlik açığı, en yeni nesil LLM’lerin artan bağlam penceresinden kaynaklanıyor. Kısa süreli hafıza olarak adlandırılabilen bağlam penceresi, bir zamanlar sadece birkaç cümleyi tutabilirken şimdi binlerce kelimeyi kullanarak bir çıktı sunuyor.

Anthropic araştırmacıları, büyük bağlam pencerelerine sahip bu modellerin bilgi isteminde o görevle ilgili çok sayıda örnek varsa, birçok görevde daha iyi performans gösterme eğiliminde olduğunu buldu. Yani bilgi isteminde çok sayıda önemsiz örnek soru varsa, cevaplar aslında zamanla daha iyi hale geliyor. Yani ilk soruda yanlış bildiği bir gerçeği yüzüncü soruda doğru bilebilir.

“Jailbreak” yöntemiyle yapay zekadan bombanın nasıl yapıldığı öğrenilebilir.

Ancak bu “bağlam içi öğrenme”nin beklenmedik bir uzantısı olarak, modeller uygunsuz sorulara yanıt verme konusunda da gelişiyor. Yani ondan hemen bir bomba yapmasını isterseniz, bunu reddedecektir. Ancak daha az zararlı 99 başka soruyu yanıtlamasını ve ardından bomba yapmasını isterseniz yanıt verme olasılığı çok daha yüksektir. Sistem, düzinelerce soru soruldukça yavaş yavaş daha fazla gizli trivia gücünü aktive ederken kullanıcının gerçekten ne istediğini kaçırıyor. 

Ekip, meslektaşlarını ve hatta rakiplerini paylaşımcı bir kültüre önayak olma umuduyla bu saldırı hakkında bilgilendirdi. Bağlam penceresini azaltmanın faydalı olabileceği gibi modelin performansı üzerinde olumsuz bir etkiye de sahip olabileceği görüldü.  Sonuç olarak, sorguları modele girmeden önce sınıflandırmak ve bağlamsallaştırmak için bir yöntem geliştiriliyor. Ancak bu yaklaşım, aldatmaya açık yeni bir modelin oluşturulmasıyla sonuçlanabilir.

Derleyen: Esin Özcan

Bültenimize Kaydolun
En yeni makalelerimizi anında almak için bültenimize abone olun!

    Etiketler:dijital güvenlikdijitaliyidirteknolojiYapay Zekayapay zeka etiğiyapay zeka güvenliği
    Bu içeriği paylaş
    Email Copy Link Print
    EkleyenEsin Özcan
    Takip et
    Yeni Medya ve İletişim öğrencisi olarak dijital dünyayla insanın kesiştiği noktaları merak ediyor. Bunun için okuyor, kendini geliştiriyor ve o dünyadan besleniyor. Farklı mecraların ve farklı insanların bir arada olduğu dijitaliyidir'in bu yolda en doğru yer olduğunu düşünüyor. Esin’in dijitaliyidir için sloganı “Dijital, farklılıklarımızı yansıtabildiğimiz zaman iyidir.” oldu.
    Önceki Haber Joker: Folie à Deux Filminin İlk Posteri Ortaya Çıktı
    Sonraki Haber Solaklık ile Nadir Genetik Varyantlar Arasında Bağlantı Bulundu
    Yorum yapılmamış

    Bir yanıt yazın Yanıtı iptal et

    Yorum yapabilmek için oturum açmalısınız.

    Editörün Seçimi

    Spotify Wrapped 2025 Rekora Koştu: Yeni Özellikler Çok Sevildi

    Spotify, 2025 Wrapped özetini yayımladıktan sonra ilk 24 saatte 200 milyon kullanıcının etkileşime geçmesiyle tüm zamanların en hızlı yükselen performansına…

    Ekleyen Eda Azap Öztemel
    6 dk okuma süresi
    Gazze Dayanışmasında Yeni Protesto Dili: Moda

    Londra’nın merkezinde geçtiğimiz aylarda düzenlenen ulusal Gazze yürüyüşünde, mesajlar kadar kıyafetler de…

    7 dk okuma süresi
    1 Milyon İzleyiciyle Tripping: Bryan Johnson’un Riskli Bahsi

    Uzun ömür girişimcisi milyarder Bryan Johnson, Oregon'da 5 gram psilosibin tüketerek beyin…

    5 dk okuma süresi

    Yazarlar

    Enis Yabar 786 İçerik
    Genel Yayın Yönetmeni
    Profil fotoğrafıEnisYabar
    Ömer Kağan Selen 459 İçerik
    Editör
    Okan Köroğlu 491 İçerik
    Kurucu | Genel Koordinatör
    Eda Azap Öztemel 186 İçerik
    Yazar
    Damla Sayan 232 İçerik
    Yazar
    Merve Tuncel 84 İçerik
    Yazar
    Berk Katık 65 İçerik
    Yazar
    Ceren Yavuz 13 İçerik

    Son günlerde...

    Call of Duty: Black Ops 7 İncelemesi

    Call of Duty: Black Ops 7, serinin hem yönsüzlüğünü hem…

    03/12/2025 21:20

    Çernobil Mantarı İnanılmaz Bir Yetenek Geliştirmiş Gibi Görünüyor

    Çernobil’in ölümcül radyasyonla dolu harabelerinde bile…

    03/12/2025 18:52

    Warner, Yapay Zeka Müzik Firmasıyla Davayı Çözdü ve Ortak Girişim Başlattı

    Warner Music Group, Suno ile yaşanan…

    03/12/2025 18:08

    Köpeklerde Kenevir Bazlı Ürünler Saldırganlığı Azaltıyor

    ABD’de yapılan kapsamlı bir araştırma, kenevir…

    03/12/2025 17:37

    Çin’in Robot Endişesi: Dev Yatırım Balonu Patlamak Üzere

    Çin, insansı robot endüstrisine aktarılan milyarlarca…

    03/12/2025 14:38

    İlgini Çekebilir

    Dijital PazarlamaSosyal Ağlar

    Walmart, Yeni İçerik Oluşturucu Platformunu Başlattı

    Sosyal ticarete erişimini genişleten Walmart, salı günü Walmart Creator platformunun beta sürümünü duyurdu. Portal, içerik oluşturucuların herhangi bir sosyal medya…

    2 dk okuma süresi
    AppleMicrosoft

    Piyasa Değeri Yüksek Şirketler Belli Oldu: Apple Birinci!

    Dünyanın en değerli şirketleri belli oldu. Apple birinci sırada yer alırken Microsoft ikinci sırada yer aldı. Samsung’un ilk 10’a girememesi…

    2 dk okuma süresi
    Editörün SeçimiFacebookMetaSosyal Ağlar

    Facebook Rekor Kırmaya Devam Ediyor

    Facebook rekor kırmasıyla ve karıştığı skandallarla bilinen bir sosyal medya platformu. Meta verilerine göre Facebook, aylık aktif kullanıcı sayısında 3,08…

    2 dk okuma süresi
    BilimEditörün Seçimi

    İlk Kadın Gök Bilimcilerin İsimleri Asteroitlere Verildi

    19. yüzyılın öncüleri Annie Maunder ve Alice Everett, onlarca yıldır büyük ölçüde atıfta bulunulmayan çalışmalarıyla nihayet hak ettikleri takdiri kazandılar.…

    5 dk okuma süresi
    Hoş geldiniz!

    Hesabınıza giriş yapın

    Username or Email Address
    Password

    Lost your password?

    Üye değil misin? kaydolmak