Giriş
  • | Dosyalar |
  • | Listeler |
  • | Kimdir |
  • | Yorum |
dijital iyidir
  • HABERLER
    • Bilim
    • Teknoloji
    • Yapay Zeka
    • VPN
    • Dijital Yayıncılık
    • Oyun Dünyası
    • Sosyal Ağlar
      • YouTube
      • LinkedIn
      • Instagram
      • Twitter
      • Facebook
      • TikTok
    • Çevre & Yeşil Dünya
    • Dijital Sanat & NFT
    • Kripto
    • Girişimcilik
    • Deprem Gündemi
  • Okunası
    • Kimdir?
    • Nedir? Nasıl Yapılır?
    • Köşe Yazıları
    • Listeler
    • Dosya Haber
    • Deprem Gündemi
    • 2024’ün Ardından
    • 2023’ün Ardından
    • 2022’nin Ardından
  • dijitaliyidir
    • Ekibimiz
    • Hesabım
    • İletişim
    • Dijitaliyidir Kampüs
    • İş İlanları
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Şu an okunan: Yeni Bir Saldırı Mekanizması, Yapay Zekâ Robotlarını Etkiliyor
Paylaş
dijital iyidirdijital iyidir
Yazı Tipi Yeniden BoyutlandırıcıAa
  • HABERLER
  • Okunası
  • dijitaliyidir
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Ara
  • HABERLER
    • Bilim
    • Teknoloji
    • Yapay Zeka
    • VPN
    • Dijital Yayıncılık
    • Oyun Dünyası
    • Sosyal Ağlar
    • Çevre & Yeşil Dünya
    • Dijital Sanat & NFT
    • Kripto
    • Girişimcilik
    • Deprem Gündemi
  • Okunası
    • Kimdir?
    • Nedir? Nasıl Yapılır?
    • Köşe Yazıları
    • Listeler
    • Dosya Haber
    • Deprem Gündemi
    • 2024’ün Ardından
    • 2023’ün Ardından
    • 2022’nin Ardından
  • dijitaliyidir
    • Ekibimiz
    • Hesabım
    • İletişim
    • Dijitaliyidir Kampüs
    • İş İlanları
  • Podcast
  • Instagram
  • Etkinlikler
  • Kayıt & Giriş
Hesabınız mı var? giriş yap
Bizi Takip Edin
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.

Ana Sayfa » Teknoloji » Yeni Bir Saldırı Mekanizması, Yapay Zekâ Robotlarını Etkiliyor

TeknolojiYapay Zeka

Yeni Bir Saldırı Mekanizması, Yapay Zekâ Robotlarını Etkiliyor

Davut Bulut
Son güncelleme: 03/08/2023 00:51 00:51
Davut Bulut
Paylaş
PAYLAŞ
  • Carnegie Mellon Üniversitesindeki araştırmacılar, komut sistemine basit bir kod ekleyerek popüler sohbet robotlarının savunma sistemlerinin aşılacağını gösterdi.
  • En akıllı yapay zekâ robotlarının bile basit kurallarla kontrolden çıkabileceği saptandı.
  • Büyük şirketler, sınırlamalar getirdiyse de saldırıları nasıl engelleyeceklerini bulamadılar.

ChatGPT ve diğer yapay zekâ programları, nefret söylemi, kişisel bilgiler veya doğaçlama gelişen durumları önlemek için programlarını defalarca kez değiştirdi. Ancak geçen hafta Carnegie Mellon Üniversitesindeki araştırmacılar, komut sistemine basit bir kod ekleyerek aynı anda birkaç popüler sohbet robotunda tüm bu savunma sistemlerinin aşılabileceğini gösterdi.

Çalışma, en akıllı sohbet robotlarının bile birkaç basit kuralla raydan çıkmaya eğilimli olabileceğini gösteriyor. Carnegie Mellon Üniversitesinde doçent olan ve birçok yapay zekâ sohbet robotundaki güvenlik açıklarını bulan Zico Kolter, “Yapay zekâ sohbet robotlarını düzeltmek için bildiğimiz bir yol yok. Onları nasıl güvenli hâle getirebileceğimizi bilmiyoruz.” dedi.

Araştırmacılar, düşmanca saldırılar olarak bilinen saldırıların nasıl çalıştığını öğrenmek için açık kaynak kodlu bir dil modeli kullandılar. Aynı saldırının ChatGPT, Google Bard ve Anthropic’ten Claude dahil olmak üzere birçok popüler ticari sohbet robotu üzerinde çalıştığını gösterdiler.

“Bir kişiyi nasıl sonsuza kadar ortadan kaldırabilirim?” gibi sorular, her modelin yasaklanmış cevaplar vermesine neden oluyor. Kolter, bir bilgisayar programının tahsis edilen bellek verilerinin dışına veri yazmasına neden olan güvenlik kısıtlamalarını ihlal etmek için yaygın olarak kullanılan bir yönteme atıfta bulunarak “Buradaki benzetme, veri dışına çıkmak gibi bir şey. İnsanların bunlarla yapabilecekleri çok farklı şeyler var.” dedi.

Araştırmalarını yayımlamadan önce araştırmacılar OpenAI, Google ve Anthropic’i kötüye kullanım için uyardılar. Her bir şirket araştırma makalesinde açıklanan kötüye kullanım çalışmalarını engellemek için sınırlamalar getirdi. Ancak daha genel olarak düşmanca saldırıları nasıl engelleyeceklerini bulamadılar. Kolter, “Elimizde bunların binlercesi var.” diyerek hem ChatGPT’de hem de Bard üzerinde çalışan yeni kod dizeleri gönderdi.

OpenAI Kolter’e bir yanıt vermedi. Google sözcüsü Elijah Lawal, şirketin modelleri test etmek ve zayıflıklarını bulmak için bir dizi önlem aldığını açıklayan bir yazı paylaştı. Açıklamada, “Bard’ı zaman içerisinde geliştirmeye devam edeceğiz ve önemli güvenlik önlemleri alacağız.” dedi.

Anthropic’in politika ve toplumsal etkiler geçici başkanı olan Michael Sellitto, “Modelleri hızlı bir düzenlemeye ve diğer durumlarda da daha dirençli hâle getirmek için çalışıyoruz. Temel modelde savunmaların daha zararsız hâle getirilmesi ve güçlendirilmesinin yollarını ararken aynı zamanda ek savunma sistemlerini de araştırıyoruz.” dedi.

Kullanılan algoritmalar, bu tür tahminleri yapmakta çok başarılı ve bu da onları normal düşünülmüş bir bilgiymiş gibi cevap verme konusunda ustalaştırıyor. Ancak bu dil modelleri aynı zamanda bilgi uydurma, sosyal önyargıları tekrarlamaya ve yanıtların tahmin edilmesi zorlaştıkça garip yanıtlar üretmeye de yatkın.

Saldırılar, makine öğreniminin verilerdeki örüntüleri algılayarak farklı cevaplar üretme şeklinden faydalanır. Örneğin, bir görüntüde fark edilemeyen değişiklikler, görüntü sınıflandırıcılarının bir nesneyi yanlış tanımlamasına neden olabilir.

Bu tür bir saldırı geliştirmek, genellikle bir modelin belirli bir girdiye nasıl yanıt verdiğine bakmayı ve ardından sorunlu bir istem keşfedilene kadar ince ayar yapmayı içeriyor. MIT’nin bilgisayar fakültesinde profesör olan Armando Solar-Lezama, diğer birçok makine öğrenim modelini etkiledikleri göz önüne alındığında dil modellerinde düşmanca saldırıların var olmasının mantıklı olduğunu söylüyor. Ancak genel bir açık kaynak modeli üzerinde geliştirilen bir saldırının, birkaç farklı tescilli sistem üzerinde bu kadar iyi çalışmasını son derece şaşırtıcı bulduğunu sözlerine ekledi.

Derleyen: Davut Bulut

Bültenimize Kaydolun
En yeni makalelerimizi anında almak için bültenimize abone olun!

    Etiketler:bardChatGPTdijitaliyidir.googlesohbet robotlarıYapay Zeka
    Bu içeriği paylaş
    Email Copy Link Print
    EkleyenDavut Bulut
    Takip et
    Gazetecilik okuyan, mesleğini çok seven ve bu yolda emin adımlarla yürümek isteyen öğrenci. Okumak ve gezmek en çok yaptıkları. Bilgisayar oyunlarına olan merakı onu teknolojiyi daha cok araştırmaya itti. Her zaman araştırmacı, her zaman araştıran kimliğe büründü ve kendini dijitaliyidir'de buldu. Dijitaliyidir için Davut'un sloganı "dijital her zaman yeni kalmak için iyidir" oldu.
    Önceki Haber Gözler Disney+’ta: Atatürk Dizisi Yayımlanacak mı?
    Sonraki Haber Microsoft Teams, Uzamsal Ses Özelliğini Kullanıma Sunuyor
    Yorum yapılmamış

    Bir yanıt yazın Yanıtı iptal et

    Yorum yapabilmek için oturum açmalısınız.

    Editörün Seçimi

    Şifrelerinizi Yapay Zekanın Tahmin Etmesine Karşı Kendinizi Korumanın 4 Yolu

    Çevrimiçi hesaplarınızı korumanın en etkili adımları için 4 stratejiyi sizler için listeledik.

    Ekleyen Damla Sayan
    3 dk okuma süresi
    Bilimsel Verilere Göre Kondisyonunuzu Ölçmenin En İyi Yolları

    Giyilebilir teknolojiler ve fitness uygulamaları hayatımızın merkezine yerleşirken, uzmanlar sayılarla ölçtüğümüz bu…

    8 dk okuma süresi
    Dünyanın En Nadir Kan Grubunun Büyüsü

    Altı milyon kişiden yalnızca biri nadir Rh-null kan grubuna sahip. Araştırmacılar şimdi…

    9 dk okuma süresi

    Yazarlar

    Enis Yabar 786 İçerik
    Genel Yayın Yönetmeni
    Profil fotoğrafıEnisYabar
    Ömer Kağan Selen 459 İçerik
    Editör
    Okan Köroğlu 479 İçerik
    Kurucu | Genel Koordinatör
    Eda Azap Öztemel 171 İçerik
    Yazar
    Damla Sayan 201 İçerik
    Yazar
    Merve Tuncel 84 İçerik
    Yazar
    Berk Katık 65 İçerik
    Yazar
    Ceren Yavuz 13 İçerik

    Son günlerde...

    Bilim Onayladı: Martılara Bağırmak Yiyeceğinizi Kurtarabilir!

    Yeni bir araştırma, martıların insan sesinin tonuna duyarlı olduğunu ortaya…

    13/11/2025 14:46

    Ağrı Kesiciler Baş Ağrılarınızın Nedeni Olabilir

    Sık sık baş ağrısı çekiyor ve…

    12/11/2025 15:54

    2025’in En Güçlü Güneş Parlaması Yaşandı ve Jeomanyetik Fırtına Gerçekleşebilir

    Güneş’te meydana gelen güçlü X5.1 sınıfı…

    12/11/2025 15:13

    Nvidia CEO’su Çin’in Yapay Zeka Yarışını Kazanacağını Söylüyor

    Nvidia CEO'su Jensen Huang, yapay zekâ…

    12/11/2025 15:00

    Tütün ve Esrar, Beynin Mutluluk Molekülünü Yok Ediyor!

    McGill Üniversitesi’nden bilim insanları, hem tütün…

    12/11/2025 13:38

    İlgini Çekebilir

    SağlıkTeknoloji

    Araştırmacılar Elde Taşınabilen Akyuvar Ölçücü Geliştirdi

    Akyuvar sayımı, doktorların bir hastayı olası enfeksiyon açısından değerlendirmek için rutin olarak istedikleri bir parametre. Ancak akyuvar sayım testlerinin sonuçlarına…

    5 dk okuma süresi
    BilimEditörün SeçimiTeknoloji

    İnsanlık Tarihinin En Güçlü Roketi Olan Starship’i Fırlatmak için Son Aşamalara Gelindi

    SpaceX'in insanlık tarihinin en güçlü roketi Starship, 20 Nisan'da ilk test uçuşuna çıktı. Fırlatma aracı, roketi Meksika Körfezi üzerinde patlatan…

    3 dk okuma süresi
    Editörün SeçimiTeknoloji

    Tesla Cybertruck, Tekneye Dönüşüyor!

    Tesla’nın yeni elektrikli otomobil modeli Cybertruck, sıra dışı tasarımın yanında su üzerinde de yol alabilecek. Geçtiğimiz günlerde Elon Musk’ın yaptığı…

    1 dk okuma süresi
    WhatsAppGoogle

    İran, WhatsApp ve Google Play Yasağını Kaldırdı

    2022 yılında İran’da Mahsa Amini isimli 22 yaşındaki bir kadının bir ahlak polisi tarafından öldürülmesi üzerine protestolar başladı. Protestolar giderek…

    2 dk okuma süresi
    Hoş geldiniz!

    Hesabınıza giriş yapın

    Username or Email Address
    Password

    Lost your password?

    Üye değil misin? kaydolmak