Yapay zekanın güvenliğini tehdit eden veri zehirlenmesi riski artıyor

Yapay zekanın güvenliğini tehdit eden veri zehirlenmesi riski artıyor

Yapay zekâ güvenliği konusunda endişeleri artıran yeni bir araştırma, ChatGPT ve Gemini gibi büyük dil modellerinin yalnızca 250 kadar az sayıda belge ile “zehirlenebileceğini” ortaya koydu. Bu durum, yapay zekâların anlamsız veya hatalı metinler üretmesine yol açabiliyor.

ARTIK HEDEFTELER

Büyük dil modelleri, giderek daha fazla alanda kullanım alanı bulmanın yanı sıra, “hedef alınabilir” hale de geliyor. Birleşik Krallık Yapay Zekâ Güvenlik Enstitüsü, Alan Turing Enstitüsü ve Anthropic ortaklığında yürütülen araştırma, sistemlerin küçük miktarda bozuk veri ile yönlendirilebileceğini gösterdi.

Bu durum, internet üzerindeki bir blog yazısının veya kişisel bir sitenin, modelin eğitimine sızabilecek kadar etkili olabileceği anlamına geliyor.

VERİ ZEHİRLENMESİ BÖYLE İŞLİYOR

Anthropic’in yayımladığı blog yazısında, “kötü niyetli aktörlerin” modele belirli metinler ekleyerek istenmeyen veya tehlikeli davranışları öğretebileceği ifade ediliyor. Bu yöntem “veri zehirlenmesi” olarak adlandırılıyor. Araştırmacılara göre, model masum ama manipülatif verilerle beslendiğinde arka kapılar (backdoor) oluşabiliyor. Bu arka kapılar, belirli ifadeler kullanıldığında modelin gizli veya beklenmedik tepkiler vermesine yol açıyor.

BİLGİ SIZDIRMAK İÇİN KULLANILIYOR

Örneğin, bir saldırgan, metin içine özel bir tetikleyici ifade gizlediğinde, yapay zekâ modeli bu ifadeyi algıladığında gizli bilgileri dışarı sızdırabiliyor veya anlamsız yanıtlar üretebiliyor. Bu durum, yalnızca yapay zekânın performansını değil, aynı zamanda kullanıcı güvenliğini de tehlikeye atıyor.

RİSK ÇOK BÜYÜK

Yapılan araştırma, yapay zekâların internetteki açık verilerle eğitilmesinin bu tür saldırılara karşı savunmasız bıraktığını vurguluyor. Yani herkesin erişebildiği bir web sayfasına yerleştirilen zararsız görünen bir paragraf, dev bir modeli bozacak kadar etkili bir etkiye sahip olabilir.

Yorum ekle

Your email address will not be published.

Kaçırmayın

Fat Brands’in iflas süreci yeni bir dava ile daha da zorlaşıyor

Fat Brands’in iflas süreci yeni bir dava ile daha da zorlaşıyor

ABD merkezli restoran zinciri Fat Brands, iflas sürecini zorlaştıran yeni bir dava…