Yapay zekanın güvenliğini tehdit eden veri zehirlenmesi riski artıyor

Yapay zekâ güvenliği konusunda endişeleri artıran yeni bir araştırma, ChatGPT ve Gemini gibi büyük dil modellerinin yalnızca 250 kadar az sayıda belge ile “zehirlenebileceğini” ortaya koydu. Bu durum, yapay zekâların anlamsız veya hatalı metinler üretmesine yol açabiliyor.

ARTIK HEDEFTELER

Büyük dil modelleri, giderek daha fazla alanda kullanım alanı bulmanın yanı sıra, “hedef alınabilir” hale de geliyor. Birleşik Krallık Yapay Zekâ Güvenlik Enstitüsü, Alan Turing Enstitüsü ve Anthropic ortaklığında yürütülen araştırma, sistemlerin küçük miktarda bozuk veri ile yönlendirilebileceğini gösterdi.

Bu durum, internet üzerindeki bir blog yazısının veya kişisel bir sitenin, modelin eğitimine sızabilecek kadar etkili olabileceği anlamına geliyor.

VERİ ZEHİRLENMESİ BÖYLE İŞLİYOR

Anthropic’in yayımladığı blog yazısında, “kötü niyetli aktörlerin” modele belirli metinler ekleyerek istenmeyen veya tehlikeli davranışları öğretebileceği ifade ediliyor. Bu yöntem “veri zehirlenmesi” olarak adlandırılıyor. Araştırmacılara göre, model masum ama manipülatif verilerle beslendiğinde arka kapılar (backdoor) oluşabiliyor. Bu arka kapılar, belirli ifadeler kullanıldığında modelin gizli veya beklenmedik tepkiler vermesine yol açıyor.

BİLGİ SIZDIRMAK İÇİN KULLANILIYOR

Örneğin, bir saldırgan, metin içine özel bir tetikleyici ifade gizlediğinde, yapay zekâ modeli bu ifadeyi algıladığında gizli bilgileri dışarı sızdırabiliyor veya anlamsız yanıtlar üretebiliyor. Bu durum, yalnızca yapay zekânın performansını değil, aynı zamanda kullanıcı güvenliğini de tehlikeye atıyor.

RİSK ÇOK BÜYÜK

Yapılan araştırma, yapay zekâların internetteki açık verilerle eğitilmesinin bu tür saldırılara karşı savunmasız bıraktığını vurguluyor. Yani herkesin erişebildiği bir web sayfasına yerleştirilen zararsız görünen bir paragraf, dev bir modeli bozacak kadar etkili bir etkiye sahip olabilir.

Yapay zekanın güvenliğini tehdit eden veri zehirlenmesi riski artıyor

ARTIK HEDEFTELER

VERİ ZEHİRLENMESİ BÖYLE İŞLİYOR

BİLGİ SIZDIRMAK İÇİN KULLANILIYOR

RİSK ÇOK BÜYÜK

Yorum ekle Yanıtı iptal et

İlgili haberler

Yapay zekanın güvenliğini tehdit eden veri zehirlenmesi riski artıyor

ARTIK HEDEFTELER

VERİ ZEHİRLENMESİ BÖYLE İŞLİYOR

BİLGİ SIZDIRMAK İÇİN KULLANILIYOR

RİSK ÇOK BÜYÜK

Yorum ekle Yanıtı iptal et

İlgili haberler

Nijerya’da Bebek Fabrikası Olarak Bilinen Yasa Dışı Merkez Çökerildi

Küresel Merkez Bankaları olası kriz senaryosunu test etmek için Washington’da toplanıyor

Allbirds, Ayakkabı Üretiminden Yapay Zeka Sektörüne Geçiş Yaptı

Savunma Teknolojisinde Devrim: Almanya Savaş Alanından Gerçek Verilere Erişiyor

Kaçırmayın

Fat Brands’in iflas süreci yeni bir dava ile daha da zorlaşıyor